x

NLP Model HW

Перейти к заказу
В этом домашнем задании вы будете работать с корпусом Harry Potter and the Action Prediction Challenge. Корпус собран из фанфиков о Гарри Поттере и состоит из двух частей: 1) сырые тексты, 2) фрагменты текстов, описывающих ситуацию, в которой произнесено заклинание.Корпус описан в статье: https://arxiv.org/pdf/1905.11037.pdfDavid Vilares and Carlos Gómez-Rodríguez. Harry Potter and the Action Prediction Challenge from Natural Language. 2019 Annual Conference of the North American Chapter of the Association for Computational Linguistics. To appear.Код для сбора корпуса находится в репозитории: https://github.com/aghie/hpac . Корпус можно скачать по инструкции из этого репозитория, но для экономии времени авторы задания уже скачали и подготовили данные к работе.Ссылки на собранный корпус:Сырые тексты: Токенизированные тексты в нижнем регистре: train-test-dev: Части 1, 2 задания должны быть выполнены на полных текстах (сырых или предобработанных -- на ваше усмотрение), Часть 3 – на разбиение на тестовое, отладочное и обучающее множества. Тестовое множество должно быть использовано исключительно для тестирования моделей, обучающее и отладочное – для выбора модели и параметров.В статье и репозитории вы найдете идеи, которые помогут вам выполнить домашнее задание. Их стоит воспринимать как руководство к действию, и не стоит их копировать и переиспользовать. Обученные модели использовать не нужно, код для их обучения можно использовать как подсказку. ПРАВИЛА Домашнее задание выполняется индивидуально.Домашнее задание сдается в системе Anytask, куда можно попасть через инвайт.Домашнее задание оформляется в отчета в ipython-тетрадке.Отчет должен содержать: нумерацию заданий и пунктов, которые вы выполнили, код решения, и понятное пошаговое описание того, что вы сделали. Отчет должен быть написан в академическом стиле, без излишнего использования сленга и с соблюдением норм русского языка.Не стоит копировать фрагменты лекций, статей и Википедии в ваш отчет.Плагиат и любое недобросоветсное цитирование приводит к обнуление оценки. Часть 1. [1 балл] Эксплоративный анализ Найдите топ-1000 слов по частоте без учета стоп-слов.Найдите топ-10 по частоте: имен, пар имя + фамилия, пар вида ''профессор'' + имя / фамилия.[бонус] Постройте тематическую модель по корпусу HPAC.[бонус] Найдите еще что-то интересное в корпусе (что-то специфичное для фанфиков или фентези-тематики) Часть 2. [2 балла] Модели представления слов Обучите модель представления слов (word2vec, GloVe, fastText или любую другую) на материале корпуса HPAC.Продемонстрируйте, как работает поиск синонимов, ассоциаций, лишних слов в обученной модели.Визуализируйте топ-1000 слов по частоте без учета стоп-слов (п. 1.1) с помощью TSNE или UMAP (https://umap-learn.readthedocs.io). Часть 3. [6.5 баллов] Классификация текстов Задача классификации формулируется так: данный фрагмент фанфика описывают какую-то ситуацию, которая предшествует произнесению заклинания. Требуется по тексту предсказать, какое именно заклинание будет произнесено. Таким образом, заклинание - это фактически метка класса. Основная мера качества – macro 1. Обучите несколько классификаторов и сравните их между собой. Оцените качество классификаторов на частых и редких классах. Какие классы чаще всего оказываются перепутаны? Связаны ли ошибки со смыслом заклинаний?Используйте фрагменты из множества train для обучения, из множества dev для отладки, из множества test – для тестирования и получения итоговых результатов.[1 балл] Используйте fastText в качестве baseline-классификатора.[2 балла] Используйте сверточные сети в качестве более продвинутого классификатора. Поэкспериментируйте с количеством и размерностью фильтров, используйте разные размеры окон, попробуйте использовать -max pooling.[2 балла] Используйте рекуррентные сети в качестве альтернативного продвинутого классификатора. Поэкспериментируйте с количеством и размерностью слоев и другими гиперпараметрами.[1.5 балла] Попробуйте расширить обучающее множество за счет аугментации данных. Если вам понадобится словарь синонимов, можно использовать WordNet (ниже вы найдете примеры).[бонус] Используйте результат max pooling'а как эмбеддинг входного текста. Визуализируйте эмбеддинги 500-1000 предложений из обучающего множества и изучите свойства получившегося пространства.[бонус] Используйте ваш любимый классификатор и любые (честные) способы повышения качества классификации и получите macro 1 больше 0.5. Часть 4. [0.5 балла] Итоги Напишите краткое резюме проделанной работы. Читали ли вы сами Гарри Поттера или фанфики о нем и помогло ли вам знание предметной области в выполнении домашнего задания? Бонусная часть. [2 балла] Skip-Gram Negative Sampling Самостоятельно реализовать и обучить модель Skip-Gram Negative Sampling. Продемонстрировать качество полученных представлений на конкретный примерах.

Найдено 7091 результат

Скрипт на Python 3 для автоматизации

Требуются навыки работы с Python 3 подключение API уже есть подробности в личку, Основная задача доработать уже готовые три скрипта которые написал GPT их нужно объеденить в один

Скрипты и боты
Опубликован:
19.09.24 09:32
Бюджет:
8000 руб.~$99.87
Правки для интернет-магазина django python

Требуется разработчик в команду. Ищем добросовестного исполнителя с опытом работы в похожих проектах. Опыт работы от 3-х лет Точное тех задания отправлю в личные сообщения. Оплата проектная. По договору

Backend
Опубликован:
19.09.24 09:02
Бюджет:
5555 руб.~$69.35
Веб-скрапинг с помощью Python

Веб-скрапинг с помощью Python включает извлечение данных с веб-сайтов с помощью автоматизированных инструментов. Наиболее распространенными библиотеками для этой задачи являются: BeautifulSoup: библиотека Python для парсинга HTML- и XML-документов, используемая для навигации, поиска и изменения дерева синтаксического анализа. Requests: простая библиотека HTTP, используемая для отправки запросов на веб-сайты и извлечения контента. Selenium: инструмент автоматизации браузера, часто используемый для парсинга динамических веб-сайтов, загружающих контент через JavaScript. Scrapy: мощный и гибкий фреймворк Python, специально разработанный для веб-скрапинга, позволяющий выполнять масштабный парсинг со встроенной поддержкой обработки запросов, ответов и конвейеров. На практике эти инструменты позволяют пользователю отправлять запрос на веб-сайт, парсить его HTML- или JSON-контент и извлекать необходимые данные программным способом. Веб-скрапинг широко используется для таких задач, как сбор данных, конкурентный анализ и мониторинг онлайн-контента.

Доработка и настройка сайта
Опубликован:
19.09.24 06:32
Бюджет:
1000 руб.~$12.49
Авторегер аккаунтов на python

Добрый день, нужен регер Facebook для массовой регистрации аккаунтов. не важно, каким способом регистрировать. главное, чтобы было валидных аккаунтов 80%. язык программирования не принципиально python. Также нужна работа с сервисом kopeechka.store для почт по API.

Скрипты и боты
Опубликован:
19.09.24 06:17
Бюджет:
30000 руб.~$374.49
Автоматизация браузера Chrome BAS/python

Нужен специалист для простенькой задачи по автоматизации браузера с предоставлением отчетности в телеграмм-бота

Скрипты и боты
Опубликован:
18.09.24 21:27
Бюджет:
14000 руб.~$174.76
Создание сложных сайтов

Навыки которые подходят: Vue, React, Next js, HTML & CSS, Jquery, Django(Python), Laravel Php, PostgreSQL, MySql. Если из вышеперечисленных навыков у вас имеется хотя бы пара, буду рад продолжить разговор в лс и объясню что надо делать. Из основного, будем делать интернет магазины, визитки, корпоративные сайты и т.д (все сайты будут с готовым дизайном). В случае отличного выполнения работы можно будет поговорить о притоке постоянных заказов в кворке

Создание сайта
Опубликован:
18.09.24 20:55
Бюджет:
150000 руб.~$1872.43
Декомпилировать exe файл на python

Нужно сделать декомпиляцию exe файла в моем скрипте, файл написан на python Задача довольно проста .

Скрипты и боты
Опубликован:
18.09.24 16:49
Бюджет:
1000 руб.~$12.49
Авторизация в telegram по tdata/session+json на python

Задача - проходить авторизацию в телеграме для покупных аккаунтов и выбирать сообщения. Работаем с покупными аккаунтами, которые поставляются вместе с информацией о сессии в виде папки tdata или файлов .session+.json. Кто в теме - поймет. В этих сообщениях мне нужно одно - запрошенный код для входа в web-версию телеграма. Мне нужно решить задачу строго на python и его библиотеках. Цену предлагайте. Примерный алгоритм: 1. Скрипт запускается для авторизации и получения сообщений для определенного аккаунта 2. В каталоге приложения лежат папки покупных аккаунтов с tdata и .session+.json. Находится инфа аккаунта. 3. Производится конвертация форматов сессий из имеющихся в pyrogram. 4. Аутентификация в телеге, выбираются сообщения которые и возвращаются. В случае ошибок - детальная инфа об ошибке. Детальное ТЗ и описание тестового сценария приложил. Нужен человек с опытом прохождения аутентификации с покупными аккаунтами и пониманием нюансов бана таких аккаунтов.

Скрипты и боты
Опубликован:
18.09.24 13:36
Бюджет:
20000 руб.~$249.66
Фулстек разработка, уровень мидл плюс

Компания: Datum О компании: Мы — компания, специализирующаяся на разработке платформ для сквозной аналитики для бизнеса и создания чат-ботов для Instagram и Telegram Наша цель — помогать бизнесу быстрее достигать целей в обороте с помощью простых, понятных систем Обязанности: Разработка и поддержка платформ для сквозной аналитики и чат-ботов. Проектирование, реализация и оптимизация баз данных. Создание и поддержка фронтенд-части приложений (интерфейсы пользователей, веб-сайты, кнопки). Работа с серверной частью и API. Интеграция различных систем и инструментов. Обеспечение высокой производительности и надежности приложений. Требования: Опыт работы в роли фулстек-разработчика от 1 года Глубокие знания языков программирования: JavaScript, HTML, CSS, Python, SQL и др. Опыт работы с современными фреймворками и библиотеками (React, Angular, Vue.js и др.). Знание технологий для работы с базами данных (MySQL, PostgreSQL, MongoDB и др.). Опыт работы с серверными технологиями и API (REST, GraphQL и др.). Умение эффективно работать в команде и самостоятельно. Навыки решения проблем и внимательность к деталям. Мы предлагаем Рассмотрим вашу цену Гибкий график работы и возможность удаленной работы. Участие в интересных проектах и возможность влиять на развитие продуктов. Дружелюбный коллектив и комфортные условия труда.

Доработка и настройка сайта
Опубликован:
18.09.24 11:03
Бюджет:
1000 руб.~$12.49
Разработка Телеграм ботов

Ищем специалиста для долгосрочного сотрудничества по обновления старых и создания новых Телеграм ботов для нашего проекта на Python + aiogram. Нужно будет настроить несколько API подключений к Твиттеру, Инстаграму и Cryptomus платежам. Все задачи будут оговариваться заранее и оплачиваться отдельно в зависимости от их сложности. Важно часто выходить на связь и оперативно реализовывать нужные изменения.

Скрипты и боты
Опубликован:
18.09.24 10:35
Бюджет:
10000 руб.~$124.83
Исправление багов в работающем телеграмм боте

Ищем программиста телеграмм бота на Python Наш действующий бот @morevolleyball_bot В нем нужно исправлять баги Улучшать работу функций Хотим найти человека на постоянной основе, кто будет еженедельно делать некоторый объем работы. Оплата за работу почасовая. Планируем занятость 10-15 часов в неделю Выбирать кандидата будем по отклику. Поэтому пожалуйста пишите то, что относится к заданию . Планируем занятость 10-15 часов в неделю

Скрипты и боты
Опубликован:
18.09.24 08:24
Бюджет:
15000 руб.~$187.25
Исправление багов в работающем телеграмм боте

Ищем программиста телеграмм бота на Python Наш действующий бот @morevolleyball_bot В нем нужно исправлять баги Улучшать... руб

Программирование и IT
Опубликован:
18.09.24 08:21
Бюджет:
7500 руб.~$93.63
Поиск клиентов

Доброго дня. Мы занимаемся разработкой ботов и приложений на python и zennoposter. Нужен специалист который умеет искать клиентов и продавать через социальные сети. Опыт необязателен. Пишите обсудим детали.

Персональный помощник
Опубликован:
18.09.24 05:30
Бюджет:
2000 руб.~$24.97
Доработать скрипт на Python, который пересылает почту с mail.ru в ТГ

В общем, нужно ДОПИСАТЬ скрипт который автоматически пересылает почту с mail.ru в ТГ. Я нашел на просторах интернета подобный код, одна его часть выполняется и работает, вторая - выдает ошибки. С Python я никогда ранее не сталкивался, но думаю там все очень просто. Скину статью, с описанием кода, скину код.Во вложении скидываю скрин ошибок.Цену ставлю рандомно - договоримся точно! Надо бы срочно, срок полторы недели.

Scripts
Опубликован:
18.09.24 03:20
Бюджет:
5000 руб.~$62.42
Бот-кликер Telegram

Бот-кликер в телеграмм. Аналог Hamster Kombat и т.д. Продается полностью готовый проект, с активными подписчиками, имеется канал сообщества. У кликера два языка Eng/ru, язык выбирает бот автоматически по языку, который установлен у пользователя в настройках telegram. Бэкэнд написан на python Django, фронтенд react js, код чистый, проект легко поддерживать. Если вы можете помочь в поиске покупателя, готов предложить комиссию 20 процентов. Ссылка на проект: https://t.me/bblcoinbot

Продажа сайтов
Опубликован:
17.09.24 23:21
Бюджет:
120000 руб.~$1497.95
Senior Python/Django разработчик

Позиция: Senior Python/Django разработчик Компания: WebGears Services (https://cyberyozh.com) Формат работы: full time,... руб

Программирование и IT
Опубликован:
17.09.24 20:09
Бюджет:
320000 руб.~$3994.51
Автоматизация создания контента (картинки)

Есть картинка (шаблон с фоном). Можно заготовить её в разных форматах (png, jpg, psd, pptx, ...).Нужно с помощью Python автоматизировать вставку данных на эту картинку (пример смотрите в прикреплённых файлах).Каждый раз должны подставляться разные данные:1) номер дня2) месяц3) картинка4) пример5) суффикс st/nd/rd/thТакже выделенные слова в примере должны закрашиваться красным цветом.Реализовать в виде класса или функции. Сделать так, чтобы могло работать на сервере.Мне нужно решение, которое позволит удобно редактировать созданные картинки. Под словом "удобно" подразумевается Photoshop / Powerpoint или любой другой редактор картинок. То есть, программа создаст шаблон c заданными данными, а человек, если что, сможет всегда что-то удобно исправить в каком-либо редакторе.Важно, чтобы картинки создавались в хорошем качестве, без артефактов (или с минимальными). В тексте используется выравнивание по центру, переносы на новую строку, разные шрифты. Это нужно учитывать.По предоплате не работаю!В отлике пишите примерные сроки выполнения работы!

Scripts
Опубликован:
17.09.24 19:52
Бюджет:
12000 руб.~$149.8
Разработчик в штат (PYTHON)

Мы в поиске талантливого и амбициозного PYTHON разработчика для присоединения к нашей динамичной команде. руб

Программирование и IT
Опубликован:
17.09.24 18:16
Бюджет:
160000 руб.~$1997.26
Убрать шифрование с файла DRM (Fasoo DRM)

Нужен скрипт (желательно на Python, но не принципиально), который сможет снимать шифрование с файла. Нужный файл прикрепил, на выходе должен получиться .cbz файл, который можно открыть любым архиватором. В качестве результата работы ожидаю увидеть исходный код программы.

Скрипты и боты
Опубликован:
17.09.24 17:03
Бюджет:
10000 руб.~$124.83
Разработка веб-скрапинга данных

Требуется разработать парсер, который будет выполнять следующие задачи: Сбор данных: Парсер должен регулярно анализировать статьи с указанного сайта на наличие определённых ключевых слов. Обработка данных: При обнаружении совпадения ключевых слов, парсер должен сохранять информацию о статье (название, ссылка, ключевое слово) в Google Sheets. Уведомления: В случае нахождения совпадений парсер должен отправлять уведомление в Telegram с информацией о статье (название, ссылка и найденное ключевое слово). Непрерывная работа: Парсер должен работать в фоновом режиме, постоянно мониторить новые статьи и обновлять результаты. Редактирование ключевых слов: Должна быть возможность гибко добавлять и изменять ключевые слова для анализа. Технические требования: Язык программирования: Python (предпочтительно). Использование Google Sheets API для работы с таблицами. Интеграция с Telegram API для отправки уведомлений. Возможность запуска парсера на сервере (Linux). Срок выполнения: 1-2 дня. Примерное вознаграждение: 1000 руб. ТЗ скину исполнителю

Скрипты и боты
Опубликован:
17.09.24 16:50
Бюджет:
2000 руб.~$24.97

Текущая страница: 80

Всего страниц: 355