x

NLP Model HW

Перейти к заказу
В этом домашнем задании вы будете работать с корпусом Harry Potter and the Action Prediction Challenge. Корпус собран из фанфиков о Гарри Поттере и состоит из двух частей: 1) сырые тексты, 2) фрагменты текстов, описывающих ситуацию, в которой произнесено заклинание.Корпус описан в статье: https://arxiv.org/pdf/1905.11037.pdfDavid Vilares and Carlos Gómez-Rodríguez. Harry Potter and the Action Prediction Challenge from Natural Language. 2019 Annual Conference of the North American Chapter of the Association for Computational Linguistics. To appear.Код для сбора корпуса находится в репозитории: https://github.com/aghie/hpac . Корпус можно скачать по инструкции из этого репозитория, но для экономии времени авторы задания уже скачали и подготовили данные к работе.Ссылки на собранный корпус:Сырые тексты: Токенизированные тексты в нижнем регистре: train-test-dev: Части 1, 2 задания должны быть выполнены на полных текстах (сырых или предобработанных -- на ваше усмотрение), Часть 3 – на разбиение на тестовое, отладочное и обучающее множества. Тестовое множество должно быть использовано исключительно для тестирования моделей, обучающее и отладочное – для выбора модели и параметров.В статье и репозитории вы найдете идеи, которые помогут вам выполнить домашнее задание. Их стоит воспринимать как руководство к действию, и не стоит их копировать и переиспользовать. Обученные модели использовать не нужно, код для их обучения можно использовать как подсказку. ПРАВИЛА Домашнее задание выполняется индивидуально.Домашнее задание сдается в системе Anytask, куда можно попасть через инвайт.Домашнее задание оформляется в отчета в ipython-тетрадке.Отчет должен содержать: нумерацию заданий и пунктов, которые вы выполнили, код решения, и понятное пошаговое описание того, что вы сделали. Отчет должен быть написан в академическом стиле, без излишнего использования сленга и с соблюдением норм русского языка.Не стоит копировать фрагменты лекций, статей и Википедии в ваш отчет.Плагиат и любое недобросоветсное цитирование приводит к обнуление оценки. Часть 1. [1 балл] Эксплоративный анализ Найдите топ-1000 слов по частоте без учета стоп-слов.Найдите топ-10 по частоте: имен, пар имя + фамилия, пар вида ''профессор'' + имя / фамилия.[бонус] Постройте тематическую модель по корпусу HPAC.[бонус] Найдите еще что-то интересное в корпусе (что-то специфичное для фанфиков или фентези-тематики) Часть 2. [2 балла] Модели представления слов Обучите модель представления слов (word2vec, GloVe, fastText или любую другую) на материале корпуса HPAC.Продемонстрируйте, как работает поиск синонимов, ассоциаций, лишних слов в обученной модели.Визуализируйте топ-1000 слов по частоте без учета стоп-слов (п. 1.1) с помощью TSNE или UMAP (https://umap-learn.readthedocs.io). Часть 3. [6.5 баллов] Классификация текстов Задача классификации формулируется так: данный фрагмент фанфика описывают какую-то ситуацию, которая предшествует произнесению заклинания. Требуется по тексту предсказать, какое именно заклинание будет произнесено. Таким образом, заклинание - это фактически метка класса. Основная мера качества – macro 1. Обучите несколько классификаторов и сравните их между собой. Оцените качество классификаторов на частых и редких классах. Какие классы чаще всего оказываются перепутаны? Связаны ли ошибки со смыслом заклинаний?Используйте фрагменты из множества train для обучения, из множества dev для отладки, из множества test – для тестирования и получения итоговых результатов.[1 балл] Используйте fastText в качестве baseline-классификатора.[2 балла] Используйте сверточные сети в качестве более продвинутого классификатора. Поэкспериментируйте с количеством и размерностью фильтров, используйте разные размеры окон, попробуйте использовать -max pooling.[2 балла] Используйте рекуррентные сети в качестве альтернативного продвинутого классификатора. Поэкспериментируйте с количеством и размерностью слоев и другими гиперпараметрами.[1.5 балла] Попробуйте расширить обучающее множество за счет аугментации данных. Если вам понадобится словарь синонимов, можно использовать WordNet (ниже вы найдете примеры).[бонус] Используйте результат max pooling'а как эмбеддинг входного текста. Визуализируйте эмбеддинги 500-1000 предложений из обучающего множества и изучите свойства получившегося пространства.[бонус] Используйте ваш любимый классификатор и любые (честные) способы повышения качества классификации и получите macro 1 больше 0.5. Часть 4. [0.5 балла] Итоги Напишите краткое резюме проделанной работы. Читали ли вы сами Гарри Поттера или фанфики о нем и помогло ли вам знание предметной области в выполнении домашнего задания? Бонусная часть. [2 балла] Skip-Gram Negative Sampling Самостоятельно реализовать и обучить модель Skip-Gram Negative Sampling. Продемонстрировать качество полученных представлений на конкретный примерах.

Найдено 7090 результатов

Настроить пайплайн автотестов в связке с Slack

Сейчас есть инструкция по ГитЛабу, есть автотесты на Python. Уже даже прилинковали со Slack ботом, но все равно есть ошибки или неточности в работе алертов, которые приходят в Slack Откликайтесь на проект только те, у кого был или есть опыт линкования автотестов и Slack С исполнителем заказа поделюсь всей остальной информацией

Юзабилити, тесты и помощь
Опубликован:
26.09.24 08:43
Бюджет:
1000 руб.~$12.49
Поддержка и доработка проекта на python

Добрый день! Нам нужна поддержка и доработка проекта написаного на Python, нужен человек который оперативно вносит правки, всегда на связи. С хорошим опытом в сфере парсинга, интеграции API, работы с Fast API. Работа оплачивается по запросу, каждая доработка в зависимости от сложности оценивается. Если мы сработаемся то работы будет много и на других проектах. Вкратце проект парсит сайт и отдает информацию по нашему написаному API.

Скрипты и боты
Опубликован:
26.09.24 07:38
Бюджет:
20000 руб.~$249.66
Поиск python разработчика для поддержки чат-бота

Студенческая анонимная площадка, где студенты публикуют свои заказы через бот, затем заказы попадают в канал, если есть исполнители которые готовы его выполнить - они откликаются непосредственно на канале или через бот, после согласования всех деталей и оплаты заказа, исполнитель приступает к выполнениюВ будущем: Интересует:- Выполнение определенных заданий время от времени ( поправить какой-то баг, изменить название кнопки, дополнить работу бота, перенести на другой сервер ...) Сотрудничать предлагаю в таком ключе: - Собираю часть правок- оцениваем- работаем Если готовы сотрудничать или есть дополнительные вопросы, готов обсуждать aiogrammongodbТз: 1) При регистрации как исполнитель, есть проблемы. После заполнения всех полей, бот выдает ошибку, что акаунт не найдет и не дает ее пройти до конца (прикрепить пример?) 2) Иногда есть проблема, когда закрываешь проект как успешный, он почему-то может закрыться два раза, и исполнитель получает двойную сумму за данный проект, хотя он был выполнен один раз; уже не раз находили данный баг, если нужно по датам могу сориентировать когда это было, но будет ли видно это в логах3) создать команду, по которой видно парные сделки которые на выполнение до сих пор, и не закрыты; это проверяю время от времени, потому что они могут висеть годами, пока их не закрыть - если их не закрывать, я постоянно буду видеть сколько денег задействовано в проектах, и значить исполнитель с этого проекта не получил оплату

Bots
Опубликован:
26.09.24 06:05
Бюджет:
4000 руб.~$49.94
Интеграция платёжного решения Crypto Bot в Telegram-бот

Необходимо интегрировать платёжную систему Crypto Bot в готовый проект Telegram-бота или предоставить отдельный фрагмент кода на Python, который отвечает за формирование чека для оплаты с использованием вебхуков. Поддерживаемые валюты и их статусы: crypto PAY TON TON (CryptoBot) crypto PAY USDT USDT (CryptoBot) crypto PAY TRX TRX (CryptoBot) crypto PAY ETH ETH (CryptoBot) crypto LTC LTC (CryptoBot)

Скрипты и боты
Опубликован:
26.09.24 02:01
Бюджет:
4000 руб.~$49.94
Разработка телеграм-бота промокоды

Telegram-бот уже создан на Python и запущен на хосте ознакомиться можно тут @Dosia_Stiralka_bot. Сейчас необходима доработка задания: - ВЫВОД Для этого бот должен уметь создавать специальные рандомные, случайные цифры. Промокод данный должен содержать случайные цифры и айди пользователя. Дополнения, которые я вижу это Однократное использование: После того как пользователь отправит промокод и он будет использован, помечай его как "использован". Если этот промокод придет еще раз, система откажет, так как код уже использован. Промокод может иметь срок действия (например, 7 дней) Если у вас есть опыт работы с Python и Telegram АР!, будем рады сотрудничеству ! Пишите в лс проект интересный и будет развиваться

Скрипты и боты
Опубликован:
25.09.24 20:01
Бюджет:
6000 руб.~$74.9
Доработка приложения на Python

Необходимо доработать приложение фронтэнд JS(React.js+React Native) и бэкэнд python.Сброшу задачи по запросу. Буду ждать от вас оценку

Backend
Опубликован:
25.09.24 18:25
Бюджет:
10000 руб.~$124.83
Бот комментатор постов в тг на python

Задача: написать телеграм бота на python который будет брать из файла каналы тг, затем брать из др файла текст сообщения, далее переходить на канал, и в последнем посте на канале оставлять комментарий, затем брать из файла следующий канал и тоже самое делать.

Скрипты и боты
Опубликован:
25.09.24 18:03
Бюджет:
4000 руб.~$49.94
Парсер групп тг по ключевым словам на python

Доброго дня. Необходимо написать парсер групп телеграм по ключевым словам на python. Задача: бот авторизуется в телеграм, затем берет ключевое слово из файла, далее вбивает в поиск телеграм и там выводится список групп. Вот их нужно спарсить в отдельный файл ввиде ссылок на группы.

Скрипты и боты
Опубликован:
25.09.24 17:57
Бюджет:
4000 руб.~$49.94
Python. Настроить стриминговый фреймворк + разработать интерфейс

В стартап связанным с стриминговым сервисов + AI, требуется Python full stack разработчик с опытом работы не менее 5 лет, умеющего самостоятельно решать сложные задачи, связанными с высоконаруженными сервисами, и оптимизации скорости работы подобных историй.Внимательно…Не работаем со студиями, только с частниками.Оставляйте ссылку на Ваш Telegram, для связи.Отправляю ТЗ лично в телеграм, после этого созваниваемся с видео (обязательно) и обсуждаем проект с каждым индивидуально.Мошенники, сразу идёте мимо, не тратьте своё время.Предстоит: 1. Развернуть готовый фреймворкдля стриминга голосовых и видеосигналов на сервере (изи)2. Наладить максимальную скорость взаимодействия интегрирующихся по API сервисов для стриминга (фреймворк + 3 сервиса с API, документации доступны для изучения).3. Реализовать базовый веб-интерфейс, для управления сервисом на основе используемого фреймворка, в соответствии с ТЗ и продолжать дорабатывать в соответствии с этапами.Дедлайны:Развернуть фреймворк, 1 день.Наладить скорость работы, 5 дней.Реализовать проектв соответствии с ТЗ, до 7 дней. Если требуется, пишите первые - @evgeniymg, сразу с описанием что уже делали.

Backend
Опубликован:
25.09.24 17:11
Бюджет:
1000000 руб.~$12482.84
Исправить ошибку в парсере для ВК

Необходимо исправить работу скрипта. Все файлы лежат тут: https://disk.yandex.ru/d/Qu98bwWyOK8E0Q Описание работы скрипта: «Была ранее программа, написанная на BAS. Новая прога реализована на Python, она делает запрос на получение постов по вк апи, получает ответ и проверяет в содержимом наличие ссылки на постер. Сейчас она проверяет всего 1 ссылку и записывает данные в result. А на BAS была сделана проверка сразу большого количества ссылок и записи их в разные файлы. Соответственно сейчас необходимо протестировать скрипт на Python, найти ошибку и доработать, чтобы можно было обрабатывать сразу большого кол-ва ссылок и записи их в разные файлы» Описание бд: «В бд каждому паблику выдается значение state 0 - еще не взяли в работу 1 - в работе 2 - отработали И получается когда грузим много пабликов, некоторые зависают на state 1 и крутят бесконечно. При том при всем паблики на которых парсинг встал, мы после отдельно прокручиваем в парсинге и они успешно проходят.» Дополнительные комментарии к проблеме: 1) «думаю как вариант мб проблема в каком то токене, когда он выдает какую то определенную ошибку и из за этого уходит в бесконечный цикл - это догадка» 2) «Главное исправить не просто с игнорирование ошибки и выходом из цикла, а именно найти ошибку и исправить ее, если делать как бы как, парсинг будет часть постов не дособирать»

Скрипты и боты
Опубликован:
25.09.24 16:01
Бюджет:
2000 руб.~$24.97
Разработка бэкэнда на Python для образоват. платформы

Требуется разработка бэкэнда для образовательной платформы на Python. Примерное тз отправляю ниже Курсы 1.Функции: Создание курса Обновление курса Удаление курса Покупка курса Получение списка курсов Получение информации о конкретном курсе 2.Сущности курса: Описание курса Цена Авторы Теги Файлы Чат (опционально) Тайтл (название) Тестирование До 4 фотографий Уроки 1.Функции: Создание урока Обновление урока Удаление урока Получение списка уроков Получение информации о конкретном уроке 2.Сущности урока: Чат (опционально) Контент урока Видео (например, YouTube) Файлы Тайтл Переходы на следующий и предыдущий уроки Пользователи 1.Функции: Создание пользователя Обновление данных пользователя Удаление пользователя Получение списка пользователей Получение информации о конкретном пользователе 2.Роли пользователей: User: может проходить курсы и уроки, общаться с учителем, покупать пакеты курсов, работать с расписанием. Admin: Полный доступ. Может создавать и редактировать курсы, уроки, пользователей, взаимодействовать с расписанием. Mentor: может проводить занятия с учениками, взаимодействовать с расписанием. Логи Функции: Получение логов. Содержание логов: Время проведения уроков, вход и выход пользователей. Календарь/Мероприятия Функции: Установка дат занятий (для ролей Admin и Mentor) Возможность писать в чат и отслеживать уроки в контексте мероприятия Редактирование занятия Страница с чатом

Создание сайта
Опубликован:
25.09.24 14:37
Бюджет:
150000 руб.~$1872.43
Декомпиляция и расшифровка Delphi в Python

Сам код получилось декомпелировать через https://github.com/crypto2011/IDR, тут скорее проблема с расшифровкой из-за незнания синтаксиса Описание Задачи: Файл Exe - программа на Delphi которая принимает файл и на его основе создает таблицу. Нужна функция получения этой таблицы на Python для более удобной работы Все вводные вышлю выбранному кандидату! Срок - 5 дней Студии к исполнению НЕ интересуют!

Юзабилити, тесты и помощь
Опубликован:
25.09.24 13:47
Бюджет:
8000 руб.~$99.87
Телеграм бот + скрипт

Регистрация пользователей, сбор статистики и автоматическое отключение пользователей в WireGuard с помощью Python и API Возможно поможет данная статья: https://habr.com/ru/companies/ispmanager/articles/764290/

Скрипты и боты
Опубликован:
25.09.24 13:15
Бюджет:
20000 руб.~$249.66
Скрипт хранения истории переписки с GPT

Необходимо разработать скрипт, который эффективно управляет и хранит обширную историю переписки с GPT. Цель заключается в том, чтобы избежать необходимости отправлять всю историю каждый раз через API GPT, используя вместо этого локальное хранилище (например, хеш) для сохранения контекста. Необходимо оптимизировать взаимодействие с API GPT и снизить затраты на его использование. Проект фокусируется на хранении данных и тесно переплетён с GPT. Возможно использовать разные наработки с github, наподобие этого https://github.com/openai/chatgpt-retrieval-plugin. Возможно есть другие варианты работы с api open.ai Цель проекта: Разработать скрипт, обеспечивающий хранение и управление большой историей переписки с GPT, с целью оптимизации использования API GPT путем минимизации объема передаваемых данных. Требования к реализации: - Язык программирования: предпочтительно Python или другой подходящий язык. - Использование официального API GPT от OpenAI. - Обеспечение безопасности хранения данных и предотвращение утечек информации. - Документирование кода и предоставление инструкций по установке и использованию скрипта.

Скрипты и боты
Опубликован:
25.09.24 13:13
Бюджет:
80000 руб.~$998.63
Доработать сервис (Python + LLM)

Добавить новые функции в текущий проектПроект на phyton, интеграция с ИИ, все на сервере, все работает. Нужно дополнить, провести тесты функционала, исправить ошибки и упаковать все в докер. Подробности в диалоге. Важно: Опыт работы с phyton, ИИ, обязательно.Задача на 5-6 часов.

Scripts
Опубликован:
25.09.24 12:01
Бюджет:
7500 руб.~$93.63
Переписать скрипт с Polling на вебхуки

Есть скрипт на python aiogram, который запускает нескольких ботов с помощью Polling. Нужно переписать его на вебхуки и потом дать подробную консультацию - что есть что и как это работает.

Скрипты и боты
Опубликован:
25.09.24 09:02
Бюджет:
3000 руб.~$37.45
Чат-бот на python в тг

Задача: дать сотрудникам возможность редактировать pdf файлы. 1. Сотрудник заходит в бота. 2. Видит список доступных PDF файлов. 3. Выбирает файл. 4. Бот выдает ему по 1 полю, которые нужно заполнить. Например, "введите значение поля "цена". И так повторяется, пока все поля в этом файле не будут заполнены. 5. В конце файл скачивается на телефон. Нужно будет сделать БД 1 с параметрами. В БД будет 3 поля: параметр - price (к примеру) название на русском - Цена текст для бота - Введите значение поля Цена Чтобы список появился в боте, нужно предусмотреть БД 2, в которую админ сможет загрузить PDF с параметрами из БД 1. Звучит сложно, но я готова созвониться и объяснить, как это будет работать)

Скрипты и боты
Опубликован:
25.09.24 07:30
Бюджет:
40000 руб.~$499.32
Написать парсер

Необходимо сделать парсер на python с записью в базу данных, для телеграм бота ниже. Тз отправлю исполнителю. Заказы со всех фриланс бирж, у тебя в телеграм! Бот ищет новые проекты по ключевым словам и присылает уведомления. https://t.me/Flassistbot

Скрипты и боты
Опубликован:
25.09.24 07:08
Бюджет:
7000 руб.~$87.38
Разработка телеграм бота Python

Необходимо разработать телеграм бот в виде веб приложения. Есть много готовых модулей с предыдущего проекта. Необходимый Стек Python, Django, Django Rest Framework, celery, redis, FastApi, Websocket, docker, Python threading, Pydantic. Необходимо будет дальнейшая поддержка. ТЗ скину в личку

Скрипты и боты
Опубликован:
25.09.24 06:14
Бюджет:
175000 руб.~$2184.5
Доработать готовый парсер на Python для сайта закупки гов

Доработать готовый парсер на Python для сайта закупки.говТехническое задание:1) Необходимо добавить в парсер поиска закупок еще один вариант поиска.2) Редактирование результата поиска перед сохранением (результат сохраняется в HTML)3) Добавление отдельной галочки что бы использовать proxy.4) Изменение результата сохранения.

Other
Опубликован:
25.09.24 03:07
Бюджет:
3000 руб.~$37.45

Текущая страница: 76

Всего страниц: 355