x

NLP Model HW

Перейти к заказу
В этом домашнем задании вы будете работать с корпусом Harry Potter and the Action Prediction Challenge. Корпус собран из фанфиков о Гарри Поттере и состоит из двух частей: 1) сырые тексты, 2) фрагменты текстов, описывающих ситуацию, в которой произнесено заклинание.Корпус описан в статье: https://arxiv.org/pdf/1905.11037.pdfDavid Vilares and Carlos Gómez-Rodríguez. Harry Potter and the Action Prediction Challenge from Natural Language. 2019 Annual Conference of the North American Chapter of the Association for Computational Linguistics. To appear.Код для сбора корпуса находится в репозитории: https://github.com/aghie/hpac . Корпус можно скачать по инструкции из этого репозитория, но для экономии времени авторы задания уже скачали и подготовили данные к работе.Ссылки на собранный корпус:Сырые тексты: Токенизированные тексты в нижнем регистре: train-test-dev: Части 1, 2 задания должны быть выполнены на полных текстах (сырых или предобработанных -- на ваше усмотрение), Часть 3 – на разбиение на тестовое, отладочное и обучающее множества. Тестовое множество должно быть использовано исключительно для тестирования моделей, обучающее и отладочное – для выбора модели и параметров.В статье и репозитории вы найдете идеи, которые помогут вам выполнить домашнее задание. Их стоит воспринимать как руководство к действию, и не стоит их копировать и переиспользовать. Обученные модели использовать не нужно, код для их обучения можно использовать как подсказку. ПРАВИЛА Домашнее задание выполняется индивидуально.Домашнее задание сдается в системе Anytask, куда можно попасть через инвайт.Домашнее задание оформляется в отчета в ipython-тетрадке.Отчет должен содержать: нумерацию заданий и пунктов, которые вы выполнили, код решения, и понятное пошаговое описание того, что вы сделали. Отчет должен быть написан в академическом стиле, без излишнего использования сленга и с соблюдением норм русского языка.Не стоит копировать фрагменты лекций, статей и Википедии в ваш отчет.Плагиат и любое недобросоветсное цитирование приводит к обнуление оценки. Часть 1. [1 балл] Эксплоративный анализ Найдите топ-1000 слов по частоте без учета стоп-слов.Найдите топ-10 по частоте: имен, пар имя + фамилия, пар вида ''профессор'' + имя / фамилия.[бонус] Постройте тематическую модель по корпусу HPAC.[бонус] Найдите еще что-то интересное в корпусе (что-то специфичное для фанфиков или фентези-тематики) Часть 2. [2 балла] Модели представления слов Обучите модель представления слов (word2vec, GloVe, fastText или любую другую) на материале корпуса HPAC.Продемонстрируйте, как работает поиск синонимов, ассоциаций, лишних слов в обученной модели.Визуализируйте топ-1000 слов по частоте без учета стоп-слов (п. 1.1) с помощью TSNE или UMAP (https://umap-learn.readthedocs.io). Часть 3. [6.5 баллов] Классификация текстов Задача классификации формулируется так: данный фрагмент фанфика описывают какую-то ситуацию, которая предшествует произнесению заклинания. Требуется по тексту предсказать, какое именно заклинание будет произнесено. Таким образом, заклинание - это фактически метка класса. Основная мера качества – macro 1. Обучите несколько классификаторов и сравните их между собой. Оцените качество классификаторов на частых и редких классах. Какие классы чаще всего оказываются перепутаны? Связаны ли ошибки со смыслом заклинаний?Используйте фрагменты из множества train для обучения, из множества dev для отладки, из множества test – для тестирования и получения итоговых результатов.[1 балл] Используйте fastText в качестве baseline-классификатора.[2 балла] Используйте сверточные сети в качестве более продвинутого классификатора. Поэкспериментируйте с количеством и размерностью фильтров, используйте разные размеры окон, попробуйте использовать -max pooling.[2 балла] Используйте рекуррентные сети в качестве альтернативного продвинутого классификатора. Поэкспериментируйте с количеством и размерностью слоев и другими гиперпараметрами.[1.5 балла] Попробуйте расширить обучающее множество за счет аугментации данных. Если вам понадобится словарь синонимов, можно использовать WordNet (ниже вы найдете примеры).[бонус] Используйте результат max pooling'а как эмбеддинг входного текста. Визуализируйте эмбеддинги 500-1000 предложений из обучающего множества и изучите свойства получившегося пространства.[бонус] Используйте ваш любимый классификатор и любые (честные) способы повышения качества классификации и получите macro 1 больше 0.5. Часть 4. [0.5 балла] Итоги Напишите краткое резюме проделанной работы. Читали ли вы сами Гарри Поттера или фанфики о нем и помогло ли вам знание предметной области в выполнении домашнего задания? Бонусная часть. [2 балла] Skip-Gram Negative Sampling Самостоятельно реализовать и обучить модель Skip-Gram Negative Sampling. Продемонстрировать качество полученных представлений на конкретный примерах.

Найдено 6350 результатов

Разработка TikTok Бота (JS Python)

Доброго времени суток. Нужно написать бота для залива видео в тикток. Есть код на гитхабе, но полную версию продают. Нужно доработать бесплатную версию. https://github.com/makiisthenes/TiktokAutoUploader?tab=readme-ov-file

Скрипты и боты
Опубликован:
14.10.24 18:38
Бюджет:
20000 руб.~$249.66
Написать Telegram бота на Python с использованием GPT API и HH.RU API

Описание Нужно написать бота в тг на питоне и развернуть на сервере. Бот будет обращаться по API к hh.ru (дока) и ChatGPT (дока). Если не работали с апишкой гпт, не страшно, я помогу.Бэкенд нужно организовать так, чтобы в будущем можно было легко прикрутить фронт, других ботов и тд. То есть основные ручки нужно сделать универсальными. О боте Телеграм бот призван облегчить процесс поиска работы через сайт hh.ru. Пользователю достаточно авторизоваться в сервисе через hh auth, выбрать параметры вакансий, и количество откликов в день. Сервис будет каждый день автоматически составлять сопроводительные письма с помощью нейросети под каждую отдельную вакансию и автоматически отправлять отклики. Функционал Авторизация пользователей через hh.ru Определение фильтров для вакансий Выгрузка подходящих под фильтры вакансий через hh apiСоздание сопроводительных писем под каждую вакансию с помощью ChatGPT API Отправка откликов через hh apiОплата счетов через Юкасса api в телеграм ботеСохранение и обновление информации о пользователях в бдЛогинБаланс откликовФильтры поискаСсылка на резюмеДругие необходимые для работы приложения поляОтправка пользователю отчета по отправленным откликамДетальное описание бота тут - https://docs.google.com/document/d/1RjnVvSaW5U8KPv...За деталями и с предложениями приходите в TG - @shternyan

Bots
Опубликован:
14.10.24 17:46
Бюджет:
15000 руб.~$187.25
Разработка bekend для мобильного приложения (Python)

Добрый день. Ищем в команду бекенд Python разработчика для мобильных приложений.Мы молодая студия разработки мобильных приложений и ботов.Наш основной стек – Flutter и Python для бекенд разработки.Работа проектная. Оплата зависит от проекта. В среднем 30-40 тыс. Подробно, все условия лично.От вас реальные знания и умения.Обязанности:-Разработка и поддержка серверной части мобильных приложений.-Проектирование и реализация RESTful API, GraphQL API и WebSocket API.-Интеграция с внешними сервисами и базами данных.-Оптимизация производительности и обеспечение безопасности приложений.Требования:-Знание принципов построения клиент-серверных архитектур.-Опыт работы с базами данных (SQL и NoSQL).-Понимание принципов работы RESTful API, GraphQL API и WebSocket API.-Умение работать в команде и хорошие коммуникативные навыки.Будет плюсом:-Опыт работы с облачными платформами (AWS, Google Cloud, Azure).-Знание контейнеризации и оркестрации (Docker, Kubernetes).-Опыт работы с CI/CD.При отборе будет дано тестовое задание (Написание небольшого сервиса для мобильного приложения).Пожалуйста, в откликах, указывайте свой тг.

Backend
Опубликован:
14.10.24 17:31
Бюджет:
30000 руб.~$374.49
Написать скрипт для исправления изображения

Прикладываю 2 варианта текстуры на которых есть "швы" Необходимо написать такой алгоритм который сможет их заретушировать без потери качества. На изображениях так же видно что часть текстуры замыленна - если есть идеи как улучшить - приветствуется. Результатом работы ожидаю увидеть скрипт на python, описание алгоритма работы, ограничения и возможности. Использование SD приветствуется

Скрипты и боты
Опубликован:
14.10.24 17:21
Бюджет:
20000 руб.~$249.66
Телеграм бот на python с API

Создать телеграм бот с функциями старт, стоп, установкой параметров, взаимодействием по API и выполнением заданных параметров. Детали и ТЗ по ссылке ниже ТЗ в гугл доке по ссылке: https://docs.google.com/document/d/1SNDum1yMpRPI4Jqnexzc8L8rhi5lP5S6C58RwVjmMcM/edit?usp=sharing деплой на сервер

Скрипты и боты
Опубликован:
14.10.24 15:54
Бюджет:
10000 руб.~$124.83
Создать скрипт для проведения фронтран транзакций

Нужно создать скрипт для проведения фронтран транзакций. Должен быть - Опыт работы с транзакциями в блокчейне, особенно в Polkadot, и механизмами их приоритизации. - Опыт разработки скриптов, ботов, смартконтрактов. - Опыт программирования на языках, используемых для разработки решений в блокчейнах (Rust, Python и т.д.)

Scripts
Опубликован:
14.10.24 15:51
Бюджет:
5000 руб.~$62.42
Создать сайт аналогичный существующему (python), на PHP

Создать полностью функционирующую копию (дизайн не так важен), но работающую на PHP и MySQL. Проект использует API яндекс директа. Есть подробное ТЗ. https://minusa.online исходник. Возможно дальнейшее развитие проекта

Создание сайта
Опубликован:
14.10.24 14:26
Бюджет:
20000 руб.~$249.66
Разработка Фуллстек+Python для парсинга

Ищу разработчика со стеком Python на бэке и любой фреймворк на фронте. Задача - на постоянной основе парсить данные о товарах из разных источников и приводить к одному формату полей для публикации в своих каталогах. Скрипты, запросы и структура данных постоянно изменяются. Задача долгосрочная. В ответе напишите вашу сумму за 10 часов работы в неделю.

Скрипты и боты
Опубликован:
14.10.24 13:41
Бюджет:
20000 руб.~$249.66
Написать парсер на python для сайта Linkedin

Основная задача парсера: вытащить данные учетной записи пользователя, записать в файл Пользователи, которые должны попадать в... руб

Программирование и IT
Опубликован:
14.10.24 13:32
Бюджет:
5000 руб.~$62.42
Написать парсер на python для сайта Linkedin

Основная задача парсера: вытащить данные учетной записи пользователя, записать в файлПользователи, которые должны попадать в выборку фильтруются по определенному алгоритму.Задача вытаскивать всех пользователей, вне зависимости от количества строк, который может дать фильтр.Необходимо будет задействовать несколько аккаунтов linkedin, чтобы не попадать под массовый парсинг. Квоты и количество аккаунтов необходимо предоставить - т.е. сказать, сколько акканутов необходимо держать в системе. Например, из расчета 1000 строк базы может делать 1 аккаунт в день. Уважаемые исполнители, если у вас нет опыта работы с linkedin, пропустите этот заказ. Если вы работали с данным сайтом, пожалуйста, задавайте вопросы. Я обязательно вышлю вам полный алгоритм действий и мы обсудим с вами возможности его реализации. Благодарю за внимание.

Bots
Опубликован:
14.10.24 13:25
Бюджет:
5000 руб.~$62.42
Написать логику отключения автовоспроизведения видео

Python. Selenium. Webdriver. Доброго времени суток! В действующий парсер Python необходимо Написать логику отключения автовоспроизведения видео на одном из веб-сайтов соц.сети Есть действующий скрипт Python, который парсит статистику видео. Используются Selenium и Webdriver для автоматизированной работы в Chrome, SQlite для базы данных из нескольких строк, и Aiogram для отправки сообщений в Т-бот. При вводе ссылки на профиль, парсится статистика видео. Необходимо написать логику отключения автоматического воспроизведения видео, потому что при парсинге этого видео, строка которую мы парсим исчезает из-за того что начинается автоматическое воспроизведение видео. Далее статистика отправляется в Т-бот сообщением. Более детально с примерами опишу в лс. Оставляйте ваши отклики

Скрипты и боты
Опубликован:
14.10.24 12:24
Бюджет:
1000 руб.~$12.49
Разработать Telegram бота Python

Нужно разработать простого телеграм бота, для мониторинга товарной позиции на определенном сайте №1, так же, добавить сравнение цены на сайте №2, если цена сайта №1 будет меньше, чем на сайте №2 - уведомление пользователю, цена обсуждаемая

Scripts
Опубликован:
14.10.24 11:47
Бюджет:
2000 руб.~$24.97
PHP разработчик для различных задач

Специалист в области php разработки, заказов много и часто, набираем контакты пятерых разработчиков, так как каждый будет закрывать свою часть согласно представленному ТЗ, сумма обсуждается за каждый заказ отдельно. Желаете получать заказы — пишите оставляя портфолио и список своих навыков. Базовые требования: Отличное владение синтаксисом языка, понимание логики, работа с алгоритмами, работа с базой данных (база— добавляем, удаляем, изменяем и т.д.) отличное понимание rest api и конечно опыт создания приложений или функций api, работа с фреймворком — laravel, так же чистая разработка без фреймворка, проектирование архитектуры приложений, микросервисы, рефакторинг, поиск и исправление ошибок, очень желательно понимание работы с front end — в частности bootstrap. С чем будем работать? Пишем модули интеграции платежных систем с нашими сервисами — yookassa, tbank, alfabank. Работаем с биллинг панелями, работаем с Wordpress, разработка своих плагинов, и многое другое. Сдача результата работ только при условии подготовки документации к выполненному заказу т.е. написали скрипт — опишите подробно его логику и задействованные компоненты. Естественно интегрируйте в проект и предоставьте исходники с подробным описанием установки. Важно! Заказ получили — оставайтесь на связи и информируйте о фактическом состоянии заказа по запросу. Заказ закрывать в обозначенные сроки, переносы сроков рассматриваются индивидуально, но не приветствуется. Приветствуется знание python и django

Скрипты и боты
Опубликован:
14.10.24 09:30
Бюджет:
7000 руб.~$87.38
Починить парсинг на Python

Нужно починить пансинг. Все детали здесь. https://docs.google.com/document/d/1bgXo86z8TLnkNFHVmU2JLkgAdtWS4Jl0AvtkXkL7Tfc/edit?tab=t.0 Код парсинга предоставлю исполнитель. Есть много других задач по развитию этого проекта. Долгосрочное сотрудничество.

Скрипты и боты
Опубликован:
14.10.24 09:13
Бюджет:
2000 руб.~$24.97
Ищу веб программистов для команды

У нас своя команда разработчиков, занимаемся проектами разного уровня сложности. Разрабатываем как веб-приложения, так и решения на языках Python, C#, C++, подходя к каждому проекту с индивидуальным вниманием и тщательностью. Наши специалисты владеют глубокими знаниями и практическим опытом, что позволяет создавать эффективные и надежные продукты для разных задач. Мы готовы реализовать любые идеи, от простых до сложных, обеспечивая высокое качество и соблюдение сроков.

Создание сайта
Опубликован:
14.10.24 07:45
Бюджет:
60000 руб.~$748.98
Извлечь компонент редактора кода (React)

В своём проекте хотим использовать редактор кода с поддержкой языка Python под MIT лицензией, реализованный в этом проекте:https://codesandbox.io/p/devbox/eager-roman-qzyyuhttps://github.com/microbit-foundation/python-edit...Нас полностью устраивает его функционал. Однако нам нужна оттуда реализация только редактора кода. Т.е. по результатам работы от исполнителя мы хотим видеть реакт приложение, которое будет содержать в себе только этот редактор и состояние, которое будет хранить значение кода для него.

Frontend
Опубликован:
14.10.24 07:33
Бюджет:
5000 руб.~$62.42
Починить Python-скрипт, который сможет отправлять запросы на сайт

Текущая проблема: Уже есть код ,который работал буквально неделю назад. Данный код могу предоставить. Имеющийся код при выполнении вызывает ошибку 403 Forbidden. Предполагается, что это связано с отсутствием необходимых заголовков или неправильной обработкой защиты Cloudflare. Важный момент, скрипт запускается из докер контейнера. Тот же самый запрос ,отправленный с того же сервера, но не из докер контейнера, получает ответ 200. Предоставлю образ докер контейнера и весь код.Ожидаемый результат: Рабочий скрипт, который может успешно выполнять запросы из докер контейнера к API BetOnline.ag и получать актуальные данные в формате JSON.

Scripts
Опубликован:
14.10.24 07:32
Бюджет:
5000 руб.~$62.42
Дублировать сайт на новый серв.,Vue.js, Nuxt.js, Python

Нужно дублировать работающий сайт с одного сервера на новый сервер с новым доменом. Сайт сделан на Vue.js и Nuxt.js, а бэкенд на Python. Задача: Полностью скопировать сайт на новый сервер. Настроить админку для нового домена. Внести изменения в авторизацию пользователей. Требуется опыт работы с Vue.js, Nuxt.js и Python. Сроки — 1 день, бюджет — 10 000. Если вы готовы взяться за проект, напишите, пожалуйста, о своем опыте и примерах работ.

Доработка и настройка сайта
Опубликован:
14.10.24 06:04
Бюджет:
10000 руб.~$124.83
Создание программы картин по номерам

Необходимо на языке python создать аналог генератора со следующего сайта: https://www.digitpaints.com/ru/generator Цвета необходимо использовать как из наиболее похожих (на выбор пользователя количество цветов). Если вы это можете сделать на другом языке (js, PHP), то пишите, обсудим. Кто сможет сделать, то по цене пишите свою если считаете, что низкая.

Скрипты и боты
Опубликован:
14.10.24 02:08
Бюджет:
8000 руб.~$99.87
Интегрировать эквайринг на платформу маркетплейса

Обязанности:Интеграция системы эквайринга для обеспечения безопасной онлайн-оплаты на платформе стартапаРазработка и настройка платежных модулей для удобного взаимодействия покупателей и продавцовОптимизация процессов платежей и возвратов с учетом комиссии маркетплейсаТестирование и обновление платежных систем для обеспечения их бесперебойной работыТребования:Опыт работы с интеграцией платежных систем и электронными деньгамиЗнание программирования (желательно PHP, Python, Java)Умение работать с API платежных систем и понимание принципов их работыЖелание повышать свои профессиональные навыки и следить за тенденциями в области онлайн-платежейОтветственность, умение работать в команде и высокий уровень самоорганизации

Other
Опубликован:
13.10.24 20:31
Бюджет:
15000 руб.~$187.25

Текущая страница: 27

Всего страниц: 318