x

NLP Model HW

Перейти к заказу
В этом домашнем задании вы будете работать с корпусом Harry Potter and the Action Prediction Challenge. Корпус собран из фанфиков о Гарри Поттере и состоит из двух частей: 1) сырые тексты, 2) фрагменты текстов, описывающих ситуацию, в которой произнесено заклинание.Корпус описан в статье: https://arxiv.org/pdf/1905.11037.pdfDavid Vilares and Carlos Gómez-Rodríguez. Harry Potter and the Action Prediction Challenge from Natural Language. 2019 Annual Conference of the North American Chapter of the Association for Computational Linguistics. To appear.Код для сбора корпуса находится в репозитории: https://github.com/aghie/hpac . Корпус можно скачать по инструкции из этого репозитория, но для экономии времени авторы задания уже скачали и подготовили данные к работе.Ссылки на собранный корпус:Сырые тексты: Токенизированные тексты в нижнем регистре: train-test-dev: Части 1, 2 задания должны быть выполнены на полных текстах (сырых или предобработанных -- на ваше усмотрение), Часть 3 – на разбиение на тестовое, отладочное и обучающее множества. Тестовое множество должно быть использовано исключительно для тестирования моделей, обучающее и отладочное – для выбора модели и параметров.В статье и репозитории вы найдете идеи, которые помогут вам выполнить домашнее задание. Их стоит воспринимать как руководство к действию, и не стоит их копировать и переиспользовать. Обученные модели использовать не нужно, код для их обучения можно использовать как подсказку. ПРАВИЛА Домашнее задание выполняется индивидуально.Домашнее задание сдается в системе Anytask, куда можно попасть через инвайт.Домашнее задание оформляется в отчета в ipython-тетрадке.Отчет должен содержать: нумерацию заданий и пунктов, которые вы выполнили, код решения, и понятное пошаговое описание того, что вы сделали. Отчет должен быть написан в академическом стиле, без излишнего использования сленга и с соблюдением норм русского языка.Не стоит копировать фрагменты лекций, статей и Википедии в ваш отчет.Плагиат и любое недобросоветсное цитирование приводит к обнуление оценки. Часть 1. [1 балл] Эксплоративный анализ Найдите топ-1000 слов по частоте без учета стоп-слов.Найдите топ-10 по частоте: имен, пар имя + фамилия, пар вида ''профессор'' + имя / фамилия.[бонус] Постройте тематическую модель по корпусу HPAC.[бонус] Найдите еще что-то интересное в корпусе (что-то специфичное для фанфиков или фентези-тематики) Часть 2. [2 балла] Модели представления слов Обучите модель представления слов (word2vec, GloVe, fastText или любую другую) на материале корпуса HPAC.Продемонстрируйте, как работает поиск синонимов, ассоциаций, лишних слов в обученной модели.Визуализируйте топ-1000 слов по частоте без учета стоп-слов (п. 1.1) с помощью TSNE или UMAP (https://umap-learn.readthedocs.io). Часть 3. [6.5 баллов] Классификация текстов Задача классификации формулируется так: данный фрагмент фанфика описывают какую-то ситуацию, которая предшествует произнесению заклинания. Требуется по тексту предсказать, какое именно заклинание будет произнесено. Таким образом, заклинание - это фактически метка класса. Основная мера качества – macro 1. Обучите несколько классификаторов и сравните их между собой. Оцените качество классификаторов на частых и редких классах. Какие классы чаще всего оказываются перепутаны? Связаны ли ошибки со смыслом заклинаний?Используйте фрагменты из множества train для обучения, из множества dev для отладки, из множества test – для тестирования и получения итоговых результатов.[1 балл] Используйте fastText в качестве baseline-классификатора.[2 балла] Используйте сверточные сети в качестве более продвинутого классификатора. Поэкспериментируйте с количеством и размерностью фильтров, используйте разные размеры окон, попробуйте использовать -max pooling.[2 балла] Используйте рекуррентные сети в качестве альтернативного продвинутого классификатора. Поэкспериментируйте с количеством и размерностью слоев и другими гиперпараметрами.[1.5 балла] Попробуйте расширить обучающее множество за счет аугментации данных. Если вам понадобится словарь синонимов, можно использовать WordNet (ниже вы найдете примеры).[бонус] Используйте результат max pooling'а как эмбеддинг входного текста. Визуализируйте эмбеддинги 500-1000 предложений из обучающего множества и изучите свойства получившегося пространства.[бонус] Используйте ваш любимый классификатор и любые (честные) способы повышения качества классификации и получите macro 1 больше 0.5. Часть 4. [0.5 балла] Итоги Напишите краткое резюме проделанной работы. Читали ли вы сами Гарри Поттера или фанфики о нем и помогло ли вам знание предметной области в выполнении домашнего задания? Бонусная часть. [2 балла] Skip-Gram Negative Sampling Самостоятельно реализовать и обучить модель Skip-Gram Negative Sampling. Продемонстрировать качество полученных представлений на конкретный примерах.

Найдено 7091 результат

Доработать телеграмм бот магазина

Уточните пожалуйста по срокам и сколько будет стоить? доработать телеграм БОТ магазина Технологии Python aiogram SQLite Более детально в прикреплённом файле

Скрипты и боты
Опубликован:
21.09.24 10:51
Бюджет:
20000 руб.~$249.66
Доработать парсер Instagram

В поисках опытного python разработчика, который сможет разобраться в чужом коде. Нужно доработать рабочий парсер Instagram. Скрипт работает через скрытое API Instagram. Нужно внести пару корректировок. Перед откликом пишите свой опыт работы.

Скрипты и боты
Опубликован:
21.09.24 09:43
Бюджет:
10000 руб.~$124.83
Требуется анализ данных

У нас есть данные, которые надо проанализировать и сделать некоторые выводы Удобнее всего будет использовать python - чтобы сделать гистограммы Данные хранятся в виде множества маленьких файлов в формате json. их читаем, и отобразаем в гистограмме со временем. В файлах есть даты событий. но сами файлы имеют временную метку - и это более точно покажет события Нам нужно понять сколько в среднем в месяц происходит событий, в среднем как пользуются клиенты приложением, кто меньше всего пользуется, кто больше всего. Нам нужно это чтобы продумать систему тарифов на основании статистики.

Скрипты и боты
Опубликован:
21.09.24 08:31
Бюджет:
1000 руб.~$12.49
Исправить ошибку в парсере на Python для Вконтакте

Тз в файле, программа на Pythone, в многопотоке.

Скрипты и боты
Опубликован:
21.09.24 06:51
Бюджет:
9000 руб.~$112.35
Парсеры криптобирж на python

Требуется написать однотипные парсеры P2P курсов на python3.8, желательно на запросах для бирж Bybit и Bitget. 1. Bybit показывает p2p курсы и без регистрации, авторизации пользователя. !! Но этих данных мало, после авторизации пользователя ему выдается и устанавливается кука secure_token, благодаря которой получается парсить скрытые для неавторизованных пользователей типы оплаты (Sberbank, Tinkoff). Поэтому в идеале - сделать авторизацию на запросах, но можно и через эмулятор браузера + автоматическое подтверждение кода на почту (любой почтовый сервис на ваш выбор) или гугл authenticator. После авторизации кука выдается на 3 дня, нужно записать время ее истечения. Далее уже парсер написан. Нужна только кука secure_token. 2. Bitget Желательно тоже на запросах, но у меня на запросах ругается - пишет включите javascript и куки.

Скрипты и боты
Опубликован:
20.09.24 22:30
Бюджет:
10000 руб.~$124.83
Бот для автоведения то канала

Нужно написать бота на python, который будет следить за публичными каналами и перекидывать выходящие из них посты в определенный приватный канал. В нем хозяин бота может по нажатию кнопки опубликовать пересланный пост в свой канал, без указания автора. Важно чтобы бот мог удалять ссылки из постов. Технические требования: Библиотеки: aiogram/pyrogram/telethon, aiosqlite, sqlalchemy или др. Бд: sqlite Уточнения по принципу работы и другие вопросы задавать в сообщениях

Скрипты и боты
Опубликован:
20.09.24 18:00
Бюджет:
2000 руб.~$24.97
Создать ТГ-бота

Создать ТГ-бота отложенных постов. функции: 1. Установка времени для постов (3 раза в день) 2. Установка выбора часового пояса 3. Возможность загружать в бота (фото,видео, текст) пачкой 4. !!АВТО режим Последовательная публикация в указанное время (фото+текст/видео+текст)с удалением из хранилища 5. !!ручной режим (добавление постов вне указанного времени)+ссылка 6. Наличие кнопок у бота 7. Язык программирования python

Скрипты и боты
Опубликован:
20.09.24 16:41
Бюджет:
10000 руб.~$124.83
Сайт на django

В крации: нужен сайт на django, язык python... с авторизацией и регистрацией. Тема: Разработка веб-приложения для САУ микроклиматом теплицы. У нас будут разработчики, которые при регистрации будут предлагать проекты по автоматизации зарегистрированным пользователям, за проекты можно голосовать, их можно комментировать, но только зарегистрированным пользователям. Можно добавить блог для публикации свежих новостей по автоматизации. В идеале хотелось бы форум для разработчиков, но форумы устарели, возможно что-то типа чата. Поиск по проектам и по авторам, вывод отдельно аккаунта автора, возможность обмениваться сообщениями Ссылка на законченный https://github.com/Ivan-318/Python318/tree/master/dz/fourth/devsearch - пример Нужно ещё реализовать теги Творчество приветствуется. Придуманная мной диаграмма компонентов: https://github.com/Ivan-318/Final_work/blob/main/%D0%94%D0%B8%D0%B0%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0%20%D0%BA%D0%BE%D0%BC%D0%BF%D0%BE%D0%BD%D0%B5%D0%BD%D1%82%D0%BE%D0%B2%20application_acs_v2.jpg (Не является последней инстанцией) Пара подходящих шаблонов: https://github.com/Ivan-318/Final_work/tree/main/templates.original (не являются последней инстанцией). Можно предложить или разработать свой шаблон.

Создание сайта
Опубликован:
20.09.24 14:26
Бюджет:
14000 руб.~$174.76
Переписать скрипт с Polling на вебхуки

Есть скрипт на python, который запускает нескольких ботов с помощью Polling. Нужно переписать его на вебхуки и потом дать подробную консультацию - что есть что и как это работает.

Скрипты и боты
Опубликован:
20.09.24 13:38
Бюджет:
3000 руб.~$37.45
Программа на С++ или Python

Необходимо создать приложение, которое будет выполнять следующий алгоритм: 1) с помощью подключенной к ПК web камеры необходимо считать положение стрелки на аналоговом стрелочном (амперметр, вольтметр) приборе. 2) определить угол отклонения стрелки от горизонтальной оси (значение в градусах, диапазон 0 - 90 градусов). 3) преобразовать значение угла (в градусах) в соответствующее значение шкалы прибора (амперы, ватты, вольты). 4) снять показания цифрового прибора (амперметр, вольтметр) по интерфейсу rs232 (485 ). 5) сравнить 2 полученных значения и определить разницу между ними. 6) сконфигурировать отчет в PDF и отправить его на сервер. В приложении, общий алгоритм на один цикл работы ПО.

Десктоп программирование
Опубликован:
20.09.24 11:10
Бюджет:
100000 руб.~$1248.29
Исправить скрипт для парсинга

Нужен опытный Python разработчик, который поможет мне устранить ошибку в скрипте парсинга. Стек: Beautiful Soup, Scrapy или Selenium

Bots
Опубликован:
20.09.24 04:23
Бюджет:
1000 руб.~$12.49
Бот на Python для miniapp telegram

Разработать бот на Python для Telegram miniapp с поддержкой многопоточности, прокси, автоматической регистрации по реферальной ссылке, автоматическим чек-ином каждые 24 часа(нажатие кнопки). Основные функциональные требования: Многопоточность (Multithreading): Бот должен поддерживать работу с несколькими потоками/ Привязка прокси к сессии (Proxy binding to session): Необходимо реализовать возможность привязки прокси к сессии пользователя. Поддержка разных типов прокси (HTTP(S), SOCKS4/5). Прокси должен быть привязан индивидуально для каждой сессии, чтобы обеспечить анонимность и безопасность. Автоматическая регистрация аккаунта по реферальной ссылке: Реализовать функционал автоматической регистрации новых пользователей по предоставленной реферальной ссылке.(Открытие мини апп по ссылке) Логирование успешной и неудачной регистрации с указанием причины ошибки (если таковые возникнут). Автоматический чек-ин каждые 24 часа: Бот должен автоматически выполнять чек-ин в боте каждые 24 часа. Сохранение информации о последнем чек-ине для каждого аккаунта. В случае сбоя или ошибки при чек-ине необходимо предусмотреть механизм повторной попытки. Поддержка pyrogram .session: Для работы с Telegram API необходимо использовать библиотеку Pyrogram. Реализация работы с .session файлами для сохранения сессий пользователей, чтобы не требовалась повторная авторизация при каждом запуске бота. Поддержка загрузки и хранения сессий с использованием безопасности и шифрования данных сессии.

Скрипты и боты
Опубликован:
19.09.24 20:51
Бюджет:
4000 руб.~$49.94
Написание постов по теме программированию для сой сетей

Ежедневно около 20+ постов по теме различным яп, описание гитов, статей, новостей. Дам примерный список источников, Понимание современных технологий, в иделае яп: Python, c++, c#, java, go, машинное обуение, linux и тп. Пишите, если готовы делать крутой и интересый ит контент

Backend
Опубликован:
19.09.24 19:18
Бюджет:
32000 руб.~$399.46
Помощь с Docker и Python

Нужна помощь с Docker и Python, был разработан тг-бот, который нужно запустить на докере в контейнере. Образ уже готов, сам контейнер запускает, но скрипт не видит файлы внутри папки. Если вкратце: Тг-бот создает с помощью вспомогательных скриптов договор на основе шаблон template.docx У себя запускаю все работает, а как пытаюсь на докере запустить - выдает ошибку, не видит файл template.docx. Уже пробовал в том числе COPY делать в Dockerfile, но это не работает

Сервера и хостинг
Опубликован:
19.09.24 17:16
Бюджет:
2000 руб.~$24.97
Разработка Telegram Web App для генерации контента

Мы ищем разработчика для создания Telegram Web App, который будет служить интерфейсом для генерации контента с помощью различных нейросетей. Наше приложение должно предоставлять пользователям возможность генерировать текстовый контент на основе их запросов и предпочтений.Требования к проекту:Функционал:Веб-приложение должно интегрироваться с Telegram и предоставлять интерфейс для взаимодействия с пользователями.Пользователи смогут вводить запросы и получать текстовый контент, сгенерированный нейросетями.Интерфейс должен быть удобным и интуитивно понятным, с возможностью настройки параметров генерации контента.Технические требования:Бэкэнд: Разработка на Python. Бэкэнд должен обеспечивать взаимодействие с нейросетями и обработку запросов от фронтенда.Фронтенд: Разработка на React. Фронтенд должен быть адаптивным и поддерживать различные устройства. Необходимо обеспечить взаимодействие с бэкэндом и обработку пользовательских запросов.Дополнительные требования:Возможность масштабирования и добавления новых нейросетей в будущем.Обеспечение безопасности данных и конфиденциальности пользователей.более подробное тз вышлю при общении

Bots
Опубликован:
19.09.24 16:23
Бюджет:
95000 руб.~$1185.87
Парсинг фото с сайта python

Необходимо собрать фотографии товаров с сайта ТЗ приложено Вроде всё подробно расписано, но если возникнут вопросы, то расскажу, покажу. Сложности не должно возникнуть. К задаче нужно приступить сразу Сегодня нужно сделать

Базы данных и клиентов
Опубликован:
19.09.24 16:16
Бюджет:
4000 руб.~$49.94
Расширить функционал ТГ бота Python

Привет, нужно на селене реализовать : 1- поиск правильной ссылки на сайте по входящей ссылке из группы в ТГ 2- расчет по калькулятору 3- систему принятия решения для отправки в группу сигнала

Скрипты и боты
Опубликован:
19.09.24 16:10
Бюджет:
5000 руб.~$62.42
Написать сайт по управлению коллективом

Нужно написать сайт для управления коллективом. Сайт будет включать функционал для создания и управления задачами, отчетов о выполнении, а также предоставлять интерфейс для общения между участникамиФункциональные требования:Спроектировать и написать систему ролей пользователей (Администратор, Менеджер, Пользователь)Система управления задачамиСистема управления проектамиСбор аналитикиСистема коммуникации пользователейТехнические требования:Уровень владения технологиями: middle+/senior-Стек: React(ts), Python Django, PostgreSQL, AWSОсобое внимание уделить безопасности(двухфакторная аутентификация, защита от CRSF и XSS)Также будет необходимо написать документацию и покрыть код юнит тестамиПишите свои tg в откликах, более подробное тз вышлю в лс

All inclusive
Опубликован:
19.09.24 16:09
Бюджет:
115000 руб.~$1435.53
Написать скрипт на Python для рассылки в Whatsapp в сервисе Wazzup

Есть сервис - https://wazzup24.com/У этого сервиса есть API, через которое можно посылать ему запросы на отправку сообщенийНужно написать Python скрипт, который будет отправлять эти API запросыУ меня есть:1) Доступ в сервис ваззап2) В этом сервисе шаблон сообщения, который, который нужно отправить по базе3) Есть также База номеров в формате +7XXXXXXXXXXПо количеству запросов к API ограничение 1000 запросов/минуту.

Bots
Опубликован:
19.09.24 15:04
Бюджет:
3000 руб.~$37.45
Доработать телеграм бота на Python

доработать телеграмм-бота на Python: автоответ на Авито, работает через API основная проблема в том, что периодами не отвечает и отрубается

Скрипты и боты
Опубликован:
19.09.24 10:30
Бюджет:
4000 руб.~$49.94

Текущая страница: 79

Всего страниц: 355