x

NLP Model HW

Перейти к заказу
В этом домашнем задании вы будете работать с корпусом Harry Potter and the Action Prediction Challenge. Корпус собран из фанфиков о Гарри Поттере и состоит из двух частей: 1) сырые тексты, 2) фрагменты текстов, описывающих ситуацию, в которой произнесено заклинание.Корпус описан в статье: https://arxiv.org/pdf/1905.11037.pdfDavid Vilares and Carlos Gómez-Rodríguez. Harry Potter and the Action Prediction Challenge from Natural Language. 2019 Annual Conference of the North American Chapter of the Association for Computational Linguistics. To appear.Код для сбора корпуса находится в репозитории: https://github.com/aghie/hpac . Корпус можно скачать по инструкции из этого репозитория, но для экономии времени авторы задания уже скачали и подготовили данные к работе.Ссылки на собранный корпус:Сырые тексты: Токенизированные тексты в нижнем регистре: train-test-dev: Части 1, 2 задания должны быть выполнены на полных текстах (сырых или предобработанных -- на ваше усмотрение), Часть 3 – на разбиение на тестовое, отладочное и обучающее множества. Тестовое множество должно быть использовано исключительно для тестирования моделей, обучающее и отладочное – для выбора модели и параметров.В статье и репозитории вы найдете идеи, которые помогут вам выполнить домашнее задание. Их стоит воспринимать как руководство к действию, и не стоит их копировать и переиспользовать. Обученные модели использовать не нужно, код для их обучения можно использовать как подсказку. ПРАВИЛА Домашнее задание выполняется индивидуально.Домашнее задание сдается в системе Anytask, куда можно попасть через инвайт.Домашнее задание оформляется в отчета в ipython-тетрадке.Отчет должен содержать: нумерацию заданий и пунктов, которые вы выполнили, код решения, и понятное пошаговое описание того, что вы сделали. Отчет должен быть написан в академическом стиле, без излишнего использования сленга и с соблюдением норм русского языка.Не стоит копировать фрагменты лекций, статей и Википедии в ваш отчет.Плагиат и любое недобросоветсное цитирование приводит к обнуление оценки. Часть 1. [1 балл] Эксплоративный анализ Найдите топ-1000 слов по частоте без учета стоп-слов.Найдите топ-10 по частоте: имен, пар имя + фамилия, пар вида ''профессор'' + имя / фамилия.[бонус] Постройте тематическую модель по корпусу HPAC.[бонус] Найдите еще что-то интересное в корпусе (что-то специфичное для фанфиков или фентези-тематики) Часть 2. [2 балла] Модели представления слов Обучите модель представления слов (word2vec, GloVe, fastText или любую другую) на материале корпуса HPAC.Продемонстрируйте, как работает поиск синонимов, ассоциаций, лишних слов в обученной модели.Визуализируйте топ-1000 слов по частоте без учета стоп-слов (п. 1.1) с помощью TSNE или UMAP (https://umap-learn.readthedocs.io). Часть 3. [6.5 баллов] Классификация текстов Задача классификации формулируется так: данный фрагмент фанфика описывают какую-то ситуацию, которая предшествует произнесению заклинания. Требуется по тексту предсказать, какое именно заклинание будет произнесено. Таким образом, заклинание - это фактически метка класса. Основная мера качества – macro 1. Обучите несколько классификаторов и сравните их между собой. Оцените качество классификаторов на частых и редких классах. Какие классы чаще всего оказываются перепутаны? Связаны ли ошибки со смыслом заклинаний?Используйте фрагменты из множества train для обучения, из множества dev для отладки, из множества test – для тестирования и получения итоговых результатов.[1 балл] Используйте fastText в качестве baseline-классификатора.[2 балла] Используйте сверточные сети в качестве более продвинутого классификатора. Поэкспериментируйте с количеством и размерностью фильтров, используйте разные размеры окон, попробуйте использовать -max pooling.[2 балла] Используйте рекуррентные сети в качестве альтернативного продвинутого классификатора. Поэкспериментируйте с количеством и размерностью слоев и другими гиперпараметрами.[1.5 балла] Попробуйте расширить обучающее множество за счет аугментации данных. Если вам понадобится словарь синонимов, можно использовать WordNet (ниже вы найдете примеры).[бонус] Используйте результат max pooling'а как эмбеддинг входного текста. Визуализируйте эмбеддинги 500-1000 предложений из обучающего множества и изучите свойства получившегося пространства.[бонус] Используйте ваш любимый классификатор и любые (честные) способы повышения качества классификации и получите macro 1 больше 0.5. Часть 4. [0.5 балла] Итоги Напишите краткое резюме проделанной работы. Читали ли вы сами Гарри Поттера или фанфики о нем и помогло ли вам знание предметной области в выполнении домашнего задания? Бонусная часть. [2 балла] Skip-Gram Negative Sampling Самостоятельно реализовать и обучить модель Skip-Gram Negative Sampling. Продемонстрировать качество полученных представлений на конкретный примерах.

Найдено 6349 результатов

Cформировать УПД через через функцию GenerateTitleXml (API Диадок)

Необходимо реализовать функцию создания УПД из своей учетной системы. API Диадока подключена, работает. Есть все необходимые данные для Диадока - BoxID покупателя и продавца, ID от ФНС.Информация из шапки и детализации УПД - в виде отдельных строк из своей системыНужно все это собрать, так чтобы получился XML файл, который примет Диадок.В документации сказано - "подготовить упрощенный XML-файл титула — UserDataXml". Вот этот момент не понимаю.Язык - Python. Но если сможете разъяснить полный цикл создания УПД для Диадок - то язык не важен.Пожалуйста не откликайтесь без опыта работы с API Диадока. С помощью гугления или ChatGpt эта задача не решается.

Backend
Опубликован:
02.11.24 06:16
Бюджет:
5000 руб.~$62.42
Разработка тг бота с функционалом парсинга

Нужен разработчик для создания простого Telegram-бота, который будет собирать контент с заданных сайтов или соцсетей и отправлять его в личные сообщения пользователю. Основные задачи для бота:Парсинг контента: Бот должен регулярно проверять определенные сайты или соцсети и собирать новый контент (тексты, изображения, ссылки).Отправка сообщений: Бот автоматически отправляет собранный контент пользователю в Telegram. Нужно настроить частоту отправки (например, раз в час или в день).Возможность уникализации контента Настройки: Сделать простые команды для управления ботом (например, /start, /stop) и возможность выбора источников, откуда собирать данные.Технические требования:Python или Node.js (на выбор).Бот должен корректно обрабатывать ошибки и работать стабильно.

Backend
Опубликован:
01.11.24 21:34
Бюджет:
15000 руб.~$187.25
Разработать функционал телеграм бота

Нужен разработчик для создания простого Telegram-бота, который будет собирать контент с заданных сайтов или соцсетей и отправлять его в личные сообщения пользователю. Основные задачи для бота:Парсинг контента: Бот должен регулярно проверять определенные сайты или соцсети и собирать новый контент (тексты, изображения, ссылки).Отправка сообщений: Бот автоматически отправляет собранный контент пользователю в Telegram. Нужно настроить частоту отправки (например, раз в час или в день).Настройки: Сделать простые команды для управления ботом (например, /start, /stop) и возможность выбора источников, откуда собирать данные.Технические требования:Python или Node.js (на выбор).Бот должен корректно обрабатывать ошибки и работать стабильно.От кандидата ждем опыт в создании ботов для Telegram и навыки парсинга данных.

Backend
Опубликован:
01.11.24 20:57
Бюджет:
1000 руб.~$12.49
Разработь Telegram бота для тату салона

Цель проекта:Разработка и внедрение телеграм-бота для автоматизации процессов взаимодействия с клиентами тату-салона. Бот должен предоставлять информацию о салоне, услугах, акциях, записи на процедуры, а также обеспечивать обратную связь с клиентами.Функциональные требования:Информация о салоне: - Предоставление общей информации о тату-салоне: адрес, контакты, режим работы. - Описание услуг, предоставляемых салоном. - Информация об акциях и специальных предложениях.Запись на процедуры: - Возможность записи на татуировки, перманентный макияж, удаление татуировок и другие процедуры. - Предоставление информации о свободных слотах для записи. - Возможность выбора специалиста и даты процедуры.Обратная связь: - Получение отзывов и предложений от клиентов. - Ответы на часто задаваемые вопросы. - Решение возникающих проблем.Статистика: - Сбор и анализ данных о посещаемости бота, записи на процедуры. - Формирование отчётов о работе бота.Нефункциональные требования:Дизайн: - Современный и стильный дизайн бота. - Удобство использования.Безопасность: - Защита персональных данных клиентов. - Соблюдение законодательства о персональных данных.Интеграция: - Возможность интеграции с другими системами тату-салона.Поддержка: - Наличие технической поддержки для решения возникающих проблем.Требования к разработке:Сроки: - Разработка и внедрение бота в течение [указать срок].Документация: - Разработка технической документации. - Тестирование бота.Требования к разработчику: - Опыт разработки телеграм-ботов. - Знание Python или другого языка программирования для разработки ботов.Требования к окружению: - Наличие Python и необходимых библиотек для разработки бота.Требования к тестированию: - Тестирование бота на соответствие требованиям.Требования к поддержке: - Наличие поддержки для решения возникающих проблем.Требования к отчётности: - Предоставление отчётов о работе бота.Это лишь пример технического задания для разработки телеграм-бота тату-салона. Вы можете дополнить или изменить его в соответствии с вашими потребностями.

Bots
Опубликован:
01.11.24 18:56
Бюджет:
100 руб.~$1.25
[playwright, python] автоматизация отправки email через аккаунты

Добрый вечер. Нужно сделать рассыльщик email, используя мои аккаунты от определённого зарубежного почтового сервиса. Использовать библиотеку playwrigh Автоматизация браузера. Многопоток. Например, если 20 потоков, а 800 аккаунтов, то будет 20 потоков по 40 аккаунтов в каждом. ТЗ есть. 15 000 рублей, подробности в телеграме

Desktop
Опубликован:
01.11.24 18:30
Бюджет:
15000 руб.~$187.25
Создать арбитражного бота на криптовалютной бирже

Создать арбитражного бота на криптовалютной бирже с выводом сигналов в телеграмм на Python. Надо будет работать с websocket спотового рынка на бирже, чтобы получать значение цен в реальном времени и с post запросами, которые надо будет найти через панель разработчика. Жду ваших предложений по цене.

Скрипты и боты
Опубликован:
01.11.24 15:33
Бюджет:
6000 руб.~$74.9
Сделать на Python страницу с результатами теста

Сделать 2 веб страницы для мобильной версии с формированием результатов психологического теста. См. дизайн.Есть готовая верстка, можете использовать ее.URL-параметры (28 шт.) будем передавать из теста на базе typeform.com:strategy_leader=10&strategy_communicator=11&strategy_master=12&strategy_expert=13&arch_manager=14&arch_expert=15&arch_creator=16&arch_investigator=17&dragon_tyrant=11&dragon_opportunist=12&dragon_impostor=13&dragon_shy=14&arch_visionary=10&arch_leader=11&arch_innovator=12&arch_mentor=13&arch_ideologist=14&arch_communicator=15&arch_partner=16&arch_speaker=17Кружочки на диаграмме в центре 3-х разных размеров в зависимости от цифры. внизу также меняются столбчатые диаграммы.

Frontend
Опубликован:
01.11.24 15:24
Бюджет:
7000 руб.~$87.38
Нужен программист на python

Под проект - доработка и написание новых фич. Мобильное приложение. Бэк на fast api Пишите Ваш опыт и ставку за час

Скрипты и боты
Опубликован:
01.11.24 14:36
Бюджет:
1000 руб.~$12.49
Разработать скрипт в Reqable

Нужен человек, имеющий опыт в знании языка Python3. Требуется написать скрипт и поковыряться с запросами\ответами! руб

Программирование и IT
Опубликован:
01.11.24 14:16
Бюджет:
20000 руб.~$249.66
Разработка чат-бота для кофейни

Создание телеграмм-бота для кофейни Цель: Разработать телеграмм-бот для заказа кофе и выпечки и управления заказами для бариста. Сторона пользователя: Просмотр меню: Актуальное меню с фотографиями и описаниями. Выбор заказа: Пользователь выбирает позиции, указывает количество и время забора. Оплата заказа: Предоплата через платежную систему. Получение номера заказа: Уникальный номер после оплаты. Уведомления о готовности: Уведомление о готовности заказа. Сторона бариста: Управление меню: Создание и изменение меню, добавление и удаление позиций. Управление наличием: Ставка позиций в "стоп" при их отсутствии. Обработка заказов: Уведомление о новых заказах с отметкой выполнения. Уведомления пользователям: Уведомление после выполнения заказа. Коммуникация с клиентом: Общение с клиентом для уточнения деталей заказа. Дополнительные функции: Отзывы и рейтинг: Оставление отзывов и оценок. История заказов: Просмотр и повторение заказов. Персонализация: Персонализированные рекомендации. Технические требования: Язык программирования: Python (pyTelegramBotAPI или Telebot). или предложите Платежная система: Интеграция с robokassa или Yandex.Money. База данных: PostgreSQL. Размещение: На сервере заказчика или аналоги с указанием тарифа. Безопасность: Защита данных: Шифрование данных и транзакций. Аутентификация: Проверка подлинности пользователей. Главный референс функционала, хотелось бы так, но про нас конечно @DurgerKingBot

Скрипты и боты
Опубликован:
01.11.24 12:59
Бюджет:
20000 руб.~$249.66
Python: синхронизация Excel файлов и Google таблиц

Написать скрипт который будет синхронизировать гугл таблицы с файлами эксель. Подробности: Скрипт должен проверять дату обновления эксель файла, если она отличается от последней считывать только новые строки и добавлять(!) их в гугл таблицу. Это важный пункт, загружать полностью все данные заново нельзя - много строк. Эксель файл может располагаться на сервере в папке апача, а может на гугл диске, смотря что проще для вас. У скрипта должен быть простой веб-интерфейс, либо файл настройки, где будет задаваться путь к эксель файлу и ссылка на гугл таблицу, регулярность проверки обновления в минутах. Должна быть возможность создать новый аналогичный блок - чтобы добавить новую пару файл-ссылка и таймер обновления. (либо новую строку в файле настройки с аналогичными параметрами, смотря, что проще) Так же надо будет настроить апач на сервере (win)

Скрипты и боты
Опубликован:
01.11.24 12:56
Бюджет:
10000 руб.~$124.83
Разработчик для проведения собеседования backend - python(fastApi)

Нужен senio разработчик, с опытом проведения собеседований для python - fastApiВакансию скину, как договоримся, скину вакансию в тг

Backend
Опубликован:
01.11.24 11:14
Бюджет:
700 руб.~$8.74
Скрипт для Telegram

Требуется скрипт (python или php), который будет отслеживать чаты и каналы telegram на появление сообщений с ключевыми словами. токен бота, id каналов и чатов, ключевых слов и id чата для отправки уведомелений задаются в настройках скрипта

Скрипты и боты
Опубликован:
01.11.24 10:03
Бюджет:
2000 руб.~$24.97
Консультация Python Machine Learning

Нужна будет консультация от человека, который хорошо разбирается в темах связанных с AI, machine learning, обработкой изображений image2image Требуется объяснить: 1. Как использовать модель локально на ПК и обрабатывать изображения 2. Возможно ли использовать модель на своем сервере 2.1 Если да, то какое среднее время отклика на обработку изображения и какая примерная конфигурация сервера 3. Какие модели по обработке изображений лучше использовать 4. Возможны и другие вопросы по ходу диалога P.S. Цена указана только за консультацию, возможно дальнейшее сотрудничество с написанием кода и повышенной ставкой оплаты

Юзабилити, тесты и помощь
Опубликован:
01.11.24 09:58
Бюджет:
3000 руб.~$37.45
Требуется парсинг Discord и досок объявлений

Для наших задач требуется специалист, с отличным знанием python и опытом в парсинге сайтов и discord. Доступ к Discord дадим через иностранный сервер. Можем предложить как выполнение разовых задач, так и длительное сотрудничество. Подробнее напишу в личку.

Скрипты и боты
Опубликован:
01.11.24 09:39
Бюджет:
60000 руб.~$748.98
Доработки существующего web-приложения

--АГЕНТСТВА И СТУДИИ ПРОШУ НЕ ОТКЛИКАТЬСЯ--Добрый день!Ищу Fullstack разработчика со знанием Python/Django + React для доработки существующего web-приложения.Доработки включают себя:1. Правка верстки нескольких страниц с несложными формами . Цель: повысить юзабилити и поправить косяки адаптивной верстки2. Интеграция с платежной системой для пополнения баланса лицевого счета3. Интеграция со сторонним сервисом для динамического построения каталогаВсе детали при личном общении.

Frontend
Опубликован:
01.11.24 09:21
Бюджет:
1500 руб.~$18.73
Сделать на Python страницу с результатами теста

сделать веб страницу на Python для мобильной версии с формированием результатов психологического теста, см. дизайн2 страницы с выводом разных параметров - см. дизайн, есть готовая верстка страницы, если нужнопараметры (28 шт.) будем передавать из теста на базе typeform.com в url?strategy_leader=10&strategy_communicator=11&strategy_master=12&strategy_expert=13&arch_manager=14&arch_expert=15&arch_creator=16&arch_investigator=17&dragon_tyrant=11&dragon_opportunist=12&dragon_impostor=13&dragon_shy=14&arch_visionary=10&arch_leader=11&arch_innovator=12&arch_mentor=13&arch_ideologist=14&arch_communicator=15&arch_partner=16&arch_speaker=17Кружочки на диаграмме в центре 3-х разных размеров в зависимости от цифры. внизу также меняются столбчатые диаграммы в зависимости от цифры.

Frontend
Опубликован:
01.11.24 08:59
Бюджет:
7000 руб.~$87.38
Разработка Аватара

1. Описание работы:o Создание аватаров через пайплайн, который включает создание исходных файлов и сборку в Blender.o Поддержка и улучшение текущего процесса сборки аватаров.o Использование инструментов Colab и других программ, связанных с разработкой аватаров.2. Требуемые навыки:o Опыт работы с 3D-моделированием, желательно в Blender.o Навыки работы с Python для автоматизации процессов, опыт работы в Google Colab.o Опыт интеграции аватаров в Unity и настройка шейдеров.3. Желательные навыки:o Работа со сторонними библиотеками.o Понимание процесса обучения нейронных сетей для улучшения моделей.

Backend
Опубликован:
01.11.24 07:52
Бюджет:
50000 руб.~$624.15
Ведение групп в ВК и каналов в телеграмме по программированию

Необходимо качественное ведение групп в Вк и каналов в телеграмме по программированию (Machine learning, Python, JavaScript). Создание уникальных, оригинальных, творческих постов. Привлечение аудитории из сообществ схожих по тематике. При положительной динамике, рассматриваем долгосрочное сотрудничество.

Article
Опубликован:
31.10.24 16:40
Бюджет:
11111 руб.~$138.7
Создать проект на requst Python

Нужен проект который на реквестах пройдет всю процедуру подачи заявки на сайте, есть действующий проект на селениуме но срок его выполнения не устраивает

Скрипты и боты
Опубликован:
31.10.24 16:38
Бюджет:
20000 руб.~$249.66

Текущая страница: 15

Всего страниц: 318