x

NLP Model HW

Перейти к заказу
В этом домашнем задании вы будете работать с корпусом Harry Potter and the Action Prediction Challenge. Корпус собран из фанфиков о Гарри Поттере и состоит из двух частей: 1) сырые тексты, 2) фрагменты текстов, описывающих ситуацию, в которой произнесено заклинание.Корпус описан в статье: https://arxiv.org/pdf/1905.11037.pdfDavid Vilares and Carlos Gómez-Rodríguez. Harry Potter and the Action Prediction Challenge from Natural Language. 2019 Annual Conference of the North American Chapter of the Association for Computational Linguistics. To appear.Код для сбора корпуса находится в репозитории: https://github.com/aghie/hpac . Корпус можно скачать по инструкции из этого репозитория, но для экономии времени авторы задания уже скачали и подготовили данные к работе.Ссылки на собранный корпус:Сырые тексты: Токенизированные тексты в нижнем регистре: train-test-dev: Части 1, 2 задания должны быть выполнены на полных текстах (сырых или предобработанных -- на ваше усмотрение), Часть 3 – на разбиение на тестовое, отладочное и обучающее множества. Тестовое множество должно быть использовано исключительно для тестирования моделей, обучающее и отладочное – для выбора модели и параметров.В статье и репозитории вы найдете идеи, которые помогут вам выполнить домашнее задание. Их стоит воспринимать как руководство к действию, и не стоит их копировать и переиспользовать. Обученные модели использовать не нужно, код для их обучения можно использовать как подсказку. ПРАВИЛА Домашнее задание выполняется индивидуально.Домашнее задание сдается в системе Anytask, куда можно попасть через инвайт.Домашнее задание оформляется в отчета в ipython-тетрадке.Отчет должен содержать: нумерацию заданий и пунктов, которые вы выполнили, код решения, и понятное пошаговое описание того, что вы сделали. Отчет должен быть написан в академическом стиле, без излишнего использования сленга и с соблюдением норм русского языка.Не стоит копировать фрагменты лекций, статей и Википедии в ваш отчет.Плагиат и любое недобросоветсное цитирование приводит к обнуление оценки. Часть 1. [1 балл] Эксплоративный анализ Найдите топ-1000 слов по частоте без учета стоп-слов.Найдите топ-10 по частоте: имен, пар имя + фамилия, пар вида ''профессор'' + имя / фамилия.[бонус] Постройте тематическую модель по корпусу HPAC.[бонус] Найдите еще что-то интересное в корпусе (что-то специфичное для фанфиков или фентези-тематики) Часть 2. [2 балла] Модели представления слов Обучите модель представления слов (word2vec, GloVe, fastText или любую другую) на материале корпуса HPAC.Продемонстрируйте, как работает поиск синонимов, ассоциаций, лишних слов в обученной модели.Визуализируйте топ-1000 слов по частоте без учета стоп-слов (п. 1.1) с помощью TSNE или UMAP (https://umap-learn.readthedocs.io). Часть 3. [6.5 баллов] Классификация текстов Задача классификации формулируется так: данный фрагмент фанфика описывают какую-то ситуацию, которая предшествует произнесению заклинания. Требуется по тексту предсказать, какое именно заклинание будет произнесено. Таким образом, заклинание - это фактически метка класса. Основная мера качества – macro 1. Обучите несколько классификаторов и сравните их между собой. Оцените качество классификаторов на частых и редких классах. Какие классы чаще всего оказываются перепутаны? Связаны ли ошибки со смыслом заклинаний?Используйте фрагменты из множества train для обучения, из множества dev для отладки, из множества test – для тестирования и получения итоговых результатов.[1 балл] Используйте fastText в качестве baseline-классификатора.[2 балла] Используйте сверточные сети в качестве более продвинутого классификатора. Поэкспериментируйте с количеством и размерностью фильтров, используйте разные размеры окон, попробуйте использовать -max pooling.[2 балла] Используйте рекуррентные сети в качестве альтернативного продвинутого классификатора. Поэкспериментируйте с количеством и размерностью слоев и другими гиперпараметрами.[1.5 балла] Попробуйте расширить обучающее множество за счет аугментации данных. Если вам понадобится словарь синонимов, можно использовать WordNet (ниже вы найдете примеры).[бонус] Используйте результат max pooling'а как эмбеддинг входного текста. Визуализируйте эмбеддинги 500-1000 предложений из обучающего множества и изучите свойства получившегося пространства.[бонус] Используйте ваш любимый классификатор и любые (честные) способы повышения качества классификации и получите macro 1 больше 0.5. Часть 4. [0.5 балла] Итоги Напишите краткое резюме проделанной работы. Читали ли вы сами Гарри Поттера или фанфики о нем и помогло ли вам знание предметной области в выполнении домашнего задания? Бонусная часть. [2 балла] Skip-Gram Negative Sampling Самостоятельно реализовать и обучить модель Skip-Gram Negative Sampling. Продемонстрировать качество полученных представлений на конкретный примерах.

Найдено 6363 результата

Нужно сделать загрузку картинок

Нужно доработать скрипт, а точнее прописать ему команду на загрузку картинок в виде ссылок с другого сайта. Скрипт написан на python для woocommerce

Скрипты и боты
Опубликован:
28.09.24 19:39
Бюджет:
2000 руб.~$24.97
Нужно подружить selenium с capmonster

Здравствуйте. Есть скрипт парсинга на python, нужно к нему подключить capmonster, чтобы мог проходить защиту cloudflare и прочих ловцов ботов.

Скрипты и боты
Опубликован:
28.09.24 17:40
Бюджет:
2000 руб.~$24.97
Python разработка

Подработка, Не полный день Ищем участника в команду. Мы предлагаем участие в проектах по реализации корпоративной системы распределения расходов на open-source решениях: Postgres, Clickhouse, Airflow, Superset, JS/Python (пилотная функциональность). Ставка: Первые две недели от 50.000 В дальнейшем от 70.000 Что Вам предстоит делать? Реализация бэкенд логики корпоративных систем: управление, ввод данных, аналитический движок (доработка Apache Superset). Доработка опен-сорс проекта Apache Superset. Требования: Опыт работы от полугода (бекенд для веб приложений с реализацией бизнес-логики как преимущество); Способность работать над задачами с проработанными требованиями и планом по реализации. Способен запустить дебаг режим и самостоятельно разобраться в причине бага; Самостоятельность работы над задачами (Открыто и оперативно сообщает старшим коллегам по команде о рисках не выполнения своих задач в срок. Самостоятельно формулирует и прорабатывает вопрос и пробует различные варианты решения прежде, чем обратиться к старшим коллегам за помощью.); Написание unit-test на обычные фукнкции; Владение базовыми командами системы контроля версий (commit, pull и push, squash, rebase); Знание структуры данных доступных по дефолту; Понимание асинхронного программирования; Знаком с обычными командами sql: select, update, delete; Опыт самостоятельной реализации простого api в одном из фреймворков (flask, FastAPI).

Десктоп программирование
Опубликован:
28.09.24 17:35
Бюджет:
135000 руб.~$1685.19
Разработка на Phalcon или Slim или Yii2 или Go

Требуется пересообрать бекенд приложения Сейчас он на Bitrix Framework Это интерфейс чатов с интеграцией с Битрикс24 У нас есть уже заготовки движка для Yii2 и для Slim И готовы рассмотреть различные фреймворки или языки программирования Важно чтобы это был быстрый движок/язык. Т е Python Django, Laravel не предлагать Мы хотим экономить ресурсы наших серверов Т е у нас работающее приложение. Пора сделать рефакторинг. приложение будет иметь EndPoint в виде RestAPI, и будет получать команды через очередь (к примеру RabbitMQ) Если вы неумеете работать с очередью - ничего страшного - дадим пример. Главное чтобы вы разбирались в движке и языке Важно чтобы вы применяли ООП

Доработка и настройка сайта
Опубликован:
28.09.24 16:34
Бюджет:
3000 руб.~$37.45
Python доработать функцию оплаты миниапп в тг

Нужно подкрутить оплату к определенным разделам в миниапп

Backend
Опубликован:
28.09.24 16:04
Бюджет:
1000 руб.~$12.49
Бэкенд сайта python

Добрый день! Хотелось бы попросить помочь доработать бэкенд для сайта на python, сам сайт на nextjs Более подробное тз направлю в сообщениях

Доработка и настройка сайта
Опубликован:
28.09.24 11:35
Бюджет:
36000 руб.~$449.39
Скрипт для отправки жалоб на Ботов с твинк-аккаунтов

Разработать скрипт (Python) для отправки жалоб на ТГ-каналы/Ботов с твинк-аккаунтов Перечень работ 1. Разработка скрипта по запросу 2. Интерфейс пользователя А) Команда/Окно добавления аккаунтов твинков (Краткое описание,Заголовок) Б) Команда/Окно ссылки на ТГ-Аккаунт/Бота (Краткое описание,Заголовок) В) Команда/Окно запуска работы скрипта (Краткое описание,Заголовок) г) Окно просмотра истории действий скрипта (Отправка жалоб - Успешно/Не успешно, Отображение информации о количестве готовых к работе твинков) 3. Графическая оболочка -По минимимуму оформить скрипт. Желательно чтобы были именно нажимаемые кнопки и поля для ввода информации, а не голый скрипт в терминале. 4. Работа скрипта через /ТОР. Не знаю нужно ли это прописывать. Готовый скрипт отправляет жалобы на указанные тгканалы / ботов, отображает историю успешных/неуспешных срабатываний, показывает количество аккаунтов которых можно использовать для атаки. Должен в себя окна ввода для пользователя, возможность пополнение базы твинков без участия владельца. Минимальное графическое оформление. Кнопки, поля ввода информации надо знать что скрипт будет запускаться на линуксе который прошит через тор и интернет там только через ТОР, работает. Плюс система не сохраняет файлы при перезагрузке, тоесть ДА желательно развернуть скрипт в вебинтерфейсе. Сроки выполнения работ 14 дней (Включая правки)

Скрипты и боты
Опубликован:
28.09.24 08:51
Бюджет:
24000 руб.~$299.59
Скрипт для андроид эмуляторов на appium python

Нужен скрипт по автоматизации действий на эмуляторах ldplayer на python с использованием appium. Подробности в тг darfhh руб

Веб-разработка
Опубликован:
28.09.24 05:57
Бюджет:
3000 руб.~$37.45
Скрипт на python + mysql автоотклики на hh.ru

Нужно написать скрипт автооткликов на вакансии для юзеров которые хранятся в бд + предусмотреть как добавлять новых юзеров (авторизовавшихся в приприложении апи) Предполагается, что скрипт будет запускаться раз в сутки и рассылать отклики) Полное тз в приложении файл в формате markdown

Скрипты и боты
Опубликован:
28.09.24 00:35
Бюджет:
6000 руб.~$74.9
Исправить дублирование в парсере, разместить на хостинг

Есть парсер на python, он парсит заказы с маркетплейса, но дублирует их. Надо пофиксить эту проблему и разместить парсер на хостинг. Скину парсер в сообщении. Сам парсер написан оп ТЗ, оно приложено, но пока делаем для единственного магазина. Использованные импорты: import requests import time import re import json from bs4 import BeautifulSoup as bs4 from datetime import datetime from playwright.sync_api import sync_playwright

Скрипты и боты
Опубликован:
27.09.24 22:54
Бюджет:
10000 руб.~$124.83
Telegram-бот для принятия заявок

Бот для принятия заявок на ремонт оборудования интернет-провайдера ну или можно переделать для другой сферы деятельности. Бот умеет: Принимать заявку от клиента, можно поставить ограничение 1 заявка в неделю. После того как клиент заполнит форму получит уведомление что заявка оформлена и напишет номер заявки. Заявку видит администратор, после чего он её принимает или отклоняет и после принятия или отмены клиенту так же приходит уведомления, так же администратор может отправить клиенту сообщение. Номер заявки генерируется случайным образом. Нужно для заказа: Для начала работы с нами, вам потребуется: Подробное описание задачи (при наличии ТЗ); Содействие во время выполнения проекта. Вид: Написание и доработка Язык разработки: Python Объем услуги в кворке: 1 парсер

Скрипты и боты
Опубликован:
27.09.24 20:41
Бюджет:
2000 руб.~$24.97
Python flask скрипт

Нужно визуализировать скрипт готовый, чтобы он отображался на стороннем сайте, сервер предоставляется, нужно просто сделать визуализацию

Скрипты и боты
Опубликован:
27.09.24 19:33
Бюджет:
20000 руб.~$249.66
Написать программу на Python (pika + RabbitMQ)

Задание в закрепленном файле. Срок - до 23-00 30 сентября. Использовать библиотеку Pika. Архитектура системы: 1) менеджер — основной процесс 2) клиент — через него происходит взаимодействие пользователя с системой и запрос данных 3) процессы-хранители данных и их реплики 4) cвязь между процессами - RabbitMQ

Скрипты и боты
Опубликован:
27.09.24 19:11
Бюджет:
6000 руб.~$74.9
Доработка сайта

У меня уже написать Front-end для сайта. У меня есть для сайта функционал на Python, но его нужно доработать и сделать интеграцию чтобы работал с ChatGPT. Все остальные подробности обсудим в ЛС

Доработка и настройка сайта
Опубликован:
27.09.24 14:32
Бюджет:
2000 руб.~$24.97
Доработка сайта python

Добрый день! Хотелось бы попросить сделать несколько доработок по бэкенду на сайте: в т.ч. создать базу данных, связать её со... руб

Программирование и IT
Опубликован:
27.09.24 14:22
Бюджет:
9000 руб.~$112.35
Скрипт для взаимодейсвия по API с Точка Банк Api

Написать python класс для взаимодейсвия по API с сервисом Точка Банк Api Класс должен уметь: 1)Проходить аутентификацию (OAuth 2.0) 2)Создавать ссылку на оплату 3)Мониторить состояние ссылки/ссылок 4)Создавать QR код на оплату 5)Мониторить состояние QR кода/кодов 6)Создавать/менять/удалять вебхук, на который приходят уведомления из банка 7)Метод, который ловит уведомление из банка и распознает что именно пришло (оплата, отмена, кто оплатил и т.п.) Требования к коду: 1)Должна быть аннотация типов переменных методов и результата выполнения метода 2)Перед каждым методом должен стоять многострочный комментарий (на Русском) описывающий суть работы метода. Также в комментарии должны быть описаны переменные метода 3)Внутри кода должны быть залогированы этапы библиотекой logging (выставить везде уровень debug, ошибки уровень error) 4)Код должен выполняться асинхронно (REST вызовы осуществляем при помощи бибиотеки httpx) 5)Методы которые непосресдственно осуществляют обращение к API (желательно сделать базовый метод, в который передают нужные аргументы остальные). Написан рекурсивно. Делается 3 попытки сделать запрос. Если все 3 попытки были не удачными - возвращаем ошибку.

Скрипты и боты
Опубликован:
27.09.24 12:16
Бюджет:
20000 руб.~$249.66
Нужен парсер на Python

Суть парсера проста, парсер заходит на все страницы сайта, находит номера телефонов, на которые пришли СМС за последние 2 часа, и считает эти номера активными. Потом парсер в многопоточном режиме собирает текст сообщений, данные об отправителе и время отправки. Далее происходит отправка данных обычными GET запросами на определенный адрес. Парсер обращается в API для того чтобы добавлять новые номера и новые смс. Сайт для парсинга quackr.io некоторые страницы закрыты под авторизацией ( доступ к тексту смс ) ТЗ / Подробности https://docs.google.com/document/d/1UUOEcSsQnUdxUvI9zsXNOPpqCCOKYCz-lbn2i3_atwc/edit?usp=sharing При соответствии результата и ТЗ, буду с вами постоянно работать по задачам поддержке и разработке новых парсеров.

Скрипты и боты
Опубликован:
27.09.24 11:30
Бюджет:
3000 руб.~$37.45
Доработка сайта python

Добрый день! Хотелось бы попросить сделать несколько доработок по бэкенду на сайте: в т.ч. создать базу данных, связать её со страницами Подробное тз направлю в сообщениях

Доработка и настройка сайта
Опубликован:
27.09.24 11:24
Бюджет:
18000 руб.~$224.7
Разработать Telegram Бота

Техническое задание (ТЗ) для разработки Telegram-бота. 1. Описание проекта Необходимо разработать Telegram-бота для организации взаимодействия с пользователями. Бот должен реализовать следующие функции: Личный кабинет (редирект на сайт) Скачать апдейтер (выбор для скачивания между гугл и яндекс диском) Выдача промокодов пользователям. Функционал массовой рассылки сообщения Смена языка Функциональные требования 2.1. Личный кабинет Пользователь взаимодействует с ботом, начиная с команды /start. При нажатие человека перенаправляет на сайт для регистрации игрового аккаунта. 2.2. Скачивание файлов Бот предоставляет пользователю ссылку на выбор для скачивания лаунчера с гугл диска или яндекс диска 2.3. Выдача промокодов База данных промокодов будет предоставлена в виде текстового файла (~5000 кодов). Процесс получения промокода: Пользователь нажимает кнопку "Забрать подарок" Бот просит пользователя вступить в указанный Telegram-канал. После подтверждения вступления бот выдает пользователю уникальный промокод и удаляет его из базы. Необходимо предотвратить многократное получение промокодов с одного аккаунта. 1. Нефункциональные требования Бот должен быть разработан с использованием Python. Исходный код должен быть легко развернут и настроен на VPS. Нужно предусмотреть возможность дальнейшего масштабирования функционала, в том числе для реализации рассылок.

Скрипты и боты
Опубликован:
27.09.24 09:49
Бюджет:
10000 руб.~$124.83
Транскрибатор с зум-созвона (Python, Openai, Zoom)

Необходимо разработать и развернуть на сервере: - Создать "бота" (код) который сможет подключиться к зум созвону (API Zoom), сможет слушать аудио поток и с помощью API OpenAI переводить аудио в текст (сохранять например в бд или текстовый документ) Важно: переводить в режим online (с минимальной задержкой) Если сможете развернуть готовое решение - тоже гуд) Предлагайте вашу цену API: https://developers.zoom.us/docs/zoom-apps/guides/meeting-bots-sdk-media-streams/ https://platform.openai.com/docs/guides/speech-to-text

Скрипты и боты
Опубликован:
27.09.24 08:58
Бюджет:
60000 руб.~$748.98

Текущая страница: 38

Всего страниц: 319