x

NLP Model HW

Перейти к заказу
В этом домашнем задании вы будете работать с корпусом Harry Potter and the Action Prediction Challenge. Корпус собран из фанфиков о Гарри Поттере и состоит из двух частей: 1) сырые тексты, 2) фрагменты текстов, описывающих ситуацию, в которой произнесено заклинание.Корпус описан в статье: https://arxiv.org/pdf/1905.11037.pdfDavid Vilares and Carlos Gómez-Rodríguez. Harry Potter and the Action Prediction Challenge from Natural Language. 2019 Annual Conference of the North American Chapter of the Association for Computational Linguistics. To appear.Код для сбора корпуса находится в репозитории: https://github.com/aghie/hpac . Корпус можно скачать по инструкции из этого репозитория, но для экономии времени авторы задания уже скачали и подготовили данные к работе.Ссылки на собранный корпус:Сырые тексты: Токенизированные тексты в нижнем регистре: train-test-dev: Части 1, 2 задания должны быть выполнены на полных текстах (сырых или предобработанных -- на ваше усмотрение), Часть 3 – на разбиение на тестовое, отладочное и обучающее множества. Тестовое множество должно быть использовано исключительно для тестирования моделей, обучающее и отладочное – для выбора модели и параметров.В статье и репозитории вы найдете идеи, которые помогут вам выполнить домашнее задание. Их стоит воспринимать как руководство к действию, и не стоит их копировать и переиспользовать. Обученные модели использовать не нужно, код для их обучения можно использовать как подсказку. ПРАВИЛА Домашнее задание выполняется индивидуально.Домашнее задание сдается в системе Anytask, куда можно попасть через инвайт.Домашнее задание оформляется в отчета в ipython-тетрадке.Отчет должен содержать: нумерацию заданий и пунктов, которые вы выполнили, код решения, и понятное пошаговое описание того, что вы сделали. Отчет должен быть написан в академическом стиле, без излишнего использования сленга и с соблюдением норм русского языка.Не стоит копировать фрагменты лекций, статей и Википедии в ваш отчет.Плагиат и любое недобросоветсное цитирование приводит к обнуление оценки. Часть 1. [1 балл] Эксплоративный анализ Найдите топ-1000 слов по частоте без учета стоп-слов.Найдите топ-10 по частоте: имен, пар имя + фамилия, пар вида ''профессор'' + имя / фамилия.[бонус] Постройте тематическую модель по корпусу HPAC.[бонус] Найдите еще что-то интересное в корпусе (что-то специфичное для фанфиков или фентези-тематики) Часть 2. [2 балла] Модели представления слов Обучите модель представления слов (word2vec, GloVe, fastText или любую другую) на материале корпуса HPAC.Продемонстрируйте, как работает поиск синонимов, ассоциаций, лишних слов в обученной модели.Визуализируйте топ-1000 слов по частоте без учета стоп-слов (п. 1.1) с помощью TSNE или UMAP (https://umap-learn.readthedocs.io). Часть 3. [6.5 баллов] Классификация текстов Задача классификации формулируется так: данный фрагмент фанфика описывают какую-то ситуацию, которая предшествует произнесению заклинания. Требуется по тексту предсказать, какое именно заклинание будет произнесено. Таким образом, заклинание - это фактически метка класса. Основная мера качества – macro 1. Обучите несколько классификаторов и сравните их между собой. Оцените качество классификаторов на частых и редких классах. Какие классы чаще всего оказываются перепутаны? Связаны ли ошибки со смыслом заклинаний?Используйте фрагменты из множества train для обучения, из множества dev для отладки, из множества test – для тестирования и получения итоговых результатов.[1 балл] Используйте fastText в качестве baseline-классификатора.[2 балла] Используйте сверточные сети в качестве более продвинутого классификатора. Поэкспериментируйте с количеством и размерностью фильтров, используйте разные размеры окон, попробуйте использовать -max pooling.[2 балла] Используйте рекуррентные сети в качестве альтернативного продвинутого классификатора. Поэкспериментируйте с количеством и размерностью слоев и другими гиперпараметрами.[1.5 балла] Попробуйте расширить обучающее множество за счет аугментации данных. Если вам понадобится словарь синонимов, можно использовать WordNet (ниже вы найдете примеры).[бонус] Используйте результат max pooling'а как эмбеддинг входного текста. Визуализируйте эмбеддинги 500-1000 предложений из обучающего множества и изучите свойства получившегося пространства.[бонус] Используйте ваш любимый классификатор и любые (честные) способы повышения качества классификации и получите macro 1 больше 0.5. Часть 4. [0.5 балла] Итоги Напишите краткое резюме проделанной работы. Читали ли вы сами Гарри Поттера или фанфики о нем и помогло ли вам знание предметной области в выполнении домашнего задания? Бонусная часть. [2 балла] Skip-Gram Negative Sampling Самостоятельно реализовать и обучить модель Skip-Gram Negative Sampling. Продемонстрировать качество полученных представлений на конкретный примерах.

Найдено 6361 результат

Графическое оформление соцсетей

Группа посвящена программированию на Python Лого должно включать легко узнаваемое лого ЯП python, но при более стильном/красочном/яблочном оформлении Нужна графика для оформления групп/профилей FB/IG/VK (с отличиями только по размеру), и рекламными баннерами С исходниками

Маркетплейсы и соцсети
Опубликован:
03.10.24 20:13
Бюджет:
10000 руб.~$124.83
Нужен поиск клиентов

Здравствуйте, я веб-разработчик с 5-летним опытом работы с Python, HTML, CSS, JavaScript и SQL. Создаю веб-приложения, Telegram-ботов, делаю разные скрипты и парсеры. Хочу найти человека, который будет заниматься поиском потенциальных клиентов. Человека, который располагает личным временем и имеет возможность мониторить платформы и чаты в поисках клиентов. Все просто, Вы находите клиентов, я выполняю работу, финансы 50/50 Долгосрочное сотрудничество

Персональный помощник
Опубликован:
03.10.24 16:40
Бюджет:
20000 руб.~$249.66
Веб Морда для эксель файла

Проект: Веб-платформа для отображения прогресса и балансов по проектам клиентов. Задача: Создать веб-приложение с авторизацией, где клиенты могут видеть прогресс и баланс по проектам. Данные будут поступать из ежедневного файла .txt с балансами проектов. Веб-морда должна отображать общий баланс и прогресс в виде графиков, а также детали по каждой строке. Функциональность: Авторизация: Экран логин/пароль, доступ к проектам клиента. Главная страница: Общий баланс по каждому проекту (6–10 проектов). Графики прогресса. Просмотр балансов по каждой строке. Структура данных: Данные из файла .txt с разделителем |. Строка включает папку клиента, балансы проектов и дату. Пример строки: C:/Blum00w22pr3y3cj | 43946 | 7265547 | 667 | 2407 | 10:1:2024. Админ-функции: Загрузка файла через FTP или админ-панель, управление базой клиентов. Графики: Прогресс каждого проекта на основе данных. Требования: Технические: HTML, CSS, JavaScript (React/Vue), Python (Flask/Django) или PHP. Возможность работы с базой данных. Безопасность: Авторизация и доступ строго ограничены. Сроки: Рабочая версия: 1 неделя. Полное завершение: до 4 недель. Интерфейс: Простой, напоминающий Excel. Возможность переключения языка (русский/английский).

Создание сайта
Опубликован:
03.10.24 16:22
Бюджет:
60000 руб.~$748.98
Обучение модели детекции объектов в режиме реального времени (python)

Цель: Обучить модель для детекции объектов.Создание программы на языке Python, где подключаем готовую модель с объектами для детекции на видео в режиме реального времени (будет вестись трансляция с камеры телефона видеопотоком, который будет обрабатываться скриптом, и при нахождении конкретного объекта в видео будет передавать полученную информацию в телеграмм бот)Более подробную информацию можно получить в сообщениях, отправлю пример работы

Other
Опубликован:
03.10.24 12:35
Бюджет:
50000 руб.~$624.15
Разработка сервиса авторизации и профилем пользователя

Авторизация и регистрация пользователей. Управление профилем пользователя. Регистрация и авторизация: Регистрация нового пользователя: принимает email, пароль, и выдает подтверждение. Активация email: отправка ссылки для подтверждения (через Mock или заглушку). Авторизация пользователя: логин по email и паролю с выдачей access_token и refresh_token (JWT). Выход из системы (logout): инвалидировать текущий токен сессии. Обновление access_token через refresh_token: для продления сессии. Управление профилем пользователя: Получение информации о пользователе: аватар, имя, email, номер телефона, адрес. Обновление профиля пользователя: изменение имени, аватара, номера телефона, адреса. Обновление пароля: изменение пароля по старому паролю или с помощью сброса. Сброс пароля: отправка ссылки на email для изменения пароля. Изменение email: изменение email с подтверждением нового адреса. Удаление аккаунта: полное удаление профиля с базы данных. Язык программирования: Python. Фреймворк: Flask (предпочтительно) или FastAPI. База данных: PostgreSQL. ORM: SQLAlchemy (если используется Flask), иначе Pydantic + SQLModel. Токены и безопасность: JWT для access и refresh токенов. Хеширование паролей: библиотека bcrypt или argon2. Валидация данных: Pydantic или Marshmallow. Swagger-документация: авто-генерация документации по всем маршрутам API. Контейнеризация: приложение должно быть упаковано в Docker-контейнер (Dockerfile).

Десктоп программирование
Опубликован:
03.10.24 10:37
Бюджет:
20000 руб.~$249.66
Нужен парсер с сайтов по ссылкам на Python

Нужен парсер с сайтов по ссылкам т.е мы загружаем список сайтов и парсим Телефоны Email WhatsApp Telegram VK Facebook Instagram На выходе хочется получить список сайтов на против которых указаны данные которые перечислили Если нужны прокси или капча просьба реализовать. Прокси как обычные так и моб а капча RuCaptcha и ручной ввод.

Скрипты и боты
Опубликован:
03.10.24 10:13
Бюджет:
6000 руб.~$74.9
скрипт Python для обработки данных Excel

Техническое задание на разработку скрипта Python для обработки данных Excel 1. Цель: Разработать скрипт на языке Python,... руб

Программирование и IT
Опубликован:
03.10.24 07:41
Бюджет:
1000 руб.~$12.49
Расширение функционала Telegram-бота на Python

Здравствуйте! Ищу опытного разработчика для доработки существующего Telegram-бота. Бот предназначен для продажи цифровых товаров, и необходимо добавить ряд новых функций. Цель: Интеграция платёжных систем для упрощения процесса покупки и автоматизации выдачи товаров. Задачи: 1 Интеграция платёжных систем: Выбрать и интегрировать одну или несколько платёжных систем (например, Stripe, PayPal) в скрипт бота. Настроить обработку платежей и валидацию транзакций. 2 Изменение механизма выдачи товаров: Переделать процесс так, чтобы после успешной покупки пользователь получал автоматическую ссылку на файлообменник (например, Google Drive, Yandex.Disk и т.д.). Обеспечить, чтобы ссылки были уникальными и действительными только для конкретного покупателя. 3 Документация: Обновить документацию по коду и описать процесс интеграции платёжной системы и выдачи товара. Требования: Опыт работы с Telegram Bot API Знание основ интеграции платёжных систем. Умение писать чистый и документированный код. Срок выполнения: до одной недели. Платформа: Telegram Язык: Python Спасибо!

Скрипты и боты
Опубликован:
02.10.24 15:33
Бюджет:
100000 руб.~$1248.29
Доработка Telegram-bot+сайт стек python vue Mongodb

Ищем исполнителней по данным задачам, в идеале это один человек с стеком python vue.js Mongo, который сможет внести правки по проекту и обслуживать в дальнейшем(сдельно), рассмотрим так же ваши отклики если вы работает только по одному из направлений python+mongo или vue.js+mongo, в таком случае будьте готовы к командой работе.Доработка telegram бота:Стек технологий: Python, MongoDBЛист доработок:Добавить функционал создания услуг, категорий и типов через бота.Добавить новые роли пользователей.Добавить функционал редактирования и удаления услуг.Исправить редирект при выполнении оплаты.Добавить функционал постбеков.Добавить сценарий для услуг, обрабатываемых вручную.Доработка сайта на Vue.js:Стек технологий: Vue.js, MongoDBПланируемые доработки:Добавить favicon.Заменить раздел сайта.Обновить контактные данные.Подключить несколько платежных систем.Исправить формы логина.Восстановить механизм восстановления пароля.Добавить query параметры для улучшения навигации.Добавить функционал уведомлений.Добавить функционал триальной покупки услуг.Исправить редиректы в нескольких местах.Более подробное описание в техническом задании.

Backend
Опубликован:
02.10.24 14:40
Бюджет:
45000 руб.~$561.73
Добавить дополнительный функционал к готовому TG боту

Цель: добавить платёжные системы в скрипт телеграм бота для продажи цифровых товаров. Добавить интеграцию с платёжной системой Cryptomus Выдачу товара переделать так, что бы покупатель получал ссылку на файлообменник после покупки. Срок исполнения: до недели Платформа: Telegram Язык: Python Код бота прикрепляю в сообщении

Скрипты и боты
Опубликован:
02.10.24 12:00
Бюджет:
100000 руб.~$1248.29
Добавить в Header параметр (работа с API на Вб)

Необходимо добавить в Header параметр и поменять файл кода на сервере. Дополнительно (так как ищем программиста для дальнейшего сотрудничества): - работа с python; - установка программ на сервер; - работа с API на Вб.

Доработка и настройка сайта
Опубликован:
02.10.24 10:36
Бюджет:
4000 руб.~$49.94
Доработать код Flask Telegeram-bot - python

Доброго времени суток. Нужна помощь в доработке проекта по телеграм боту и админ панели для него срочно! Оплата небольшая 1000 рублей в час. Работа удаленнно на моем ПК, предоплаты рассматриваются.

All inclusive
Опубликован:
02.10.24 09:57
Бюджет:
1000 руб.~$12.49
Data Analyst в SaaS-проект (e-commerce, аналитика)

Проект: Разработка SaaS-приложение для продавцов на Allegro.pl, которое автоматизирует процессы расчета остатков, рентабельности, планирования продаж и заказов, а также учета расходов и налогообложения. Продукт основан на отчетах, реализованных в Excel, которые сейчас автоматизируются на Python. Цель: Ищем Data Analyst, который будет ответственен за анализ данных, расчет ключевых показателей эффективности (KPI), разработку отчетности, и автоматизацию финансовых расчетов (Cash Flow, P&L и другие) для оптимизации бизнес-процессов. Задачи: 1.Анализ данных по продажам, остаткам товаров и рентабельности. 2.Оптимизация и автоматизация управленческой отчетности (Cash Flow, P&L). 3.Расчет и автоматизация ключевых финансовых показателей. 4.Взаимодействие с разработчиком для интеграции аналитики в SaaS-продукт. 5.Подготовка аналитических выводов для улучшения бизнес-процессов и принятия решений. Требования: Уверенное владение Excel. Опыт работы с большими массивами данных. Знание SQL (желательно) и/или Python. Опыт работы в сфере e-commerce или ритейла. Понимание финансовых показателей (Gross Margin, Cash Flow). Опыт работы с BI-инструментами (Power BI, Tableau) будет преимуществом. Условия работы: Удаленная работа. Возможность гибкого графика.

Персональный помощник
Опубликован:
02.10.24 09:15
Бюджет:
20000 руб.~$249.66
Добавить выгрузку в Excel

Добрый день. Есть скрипт на Python, парсящий сайт каждые 5 минут, и отправляющий уведомления в т-бот со статистикой Необходимо реализовать функционал выгрузки статистики (которую парсим с сайта) в Excel формат То есть: в т-боте пишем команду /excel, далее вся статистика за последние сутки выгружается в Excel, и отправляется в т-бот файлом .XLSX

Десктоп программирование
Опубликован:
02.10.24 08:03
Бюджет:
2000 руб.~$24.97
Динамичное ценообразование на самообучающейся модели

Наша компания ищет опытного дата саентиста для разработки модели динамичного ценообразования на основе исторических данных. Модель должна использоваться для оптимизации цен на 600,000 уникальных товаров, продаваемых через 15 различных каналов. Целью является максимизация количества заказов при помощи предсказания оптимальной цены для каждого товара. Обязанности: Сбор и анализ данных: Изучить исторические данные по 4,000,000 заказам, включая информацию о ценах, количестве продаж и характеристиках товаров. Проанализировать данные для выявления паттернов и трендов. Построение модели: Разработать самообучающуюся модель, способную предсказывать оптимальную цену для каждого товара. Модель должна учитывать различные факторы, включая, но не ограничиваясь: сезонностью, акциями, изменениями в спросе, а также ценами конкурентов. Тестирование и валидация: Провести тестирование модели на исторических данных для оценки ее точности. Настроить модель на основе полученных результатов и внести необходимые изменения для повышения эффективности. Требования: Опыт работы с моделями машинного обучения и статистическим анализом. Знание Python или R для анализа данных и построения моделей. Опыт работы с большими данными и облачными платформами (например, AWS, Google Cloud). Умение работать с библиотеками для анализа данных (Pandas, NumPy, Scikit-learn) и визуализации (Matplotlib, Seaborn). Опыт в области ценообразования и управления запасами будет плюсом.

Скрипты и боты
Опубликован:
02.10.24 07:30
Бюджет:
80000 руб.~$998.63
Извлечь компонент редактора кода (React)

В своём проекте хотим использовать редактор кода с поддержкой языка Python под MIT лицензией, реализованный в этом проекте: https://codesandbox.io/p/devbox/eager-roman-qzyyu https://github.com/microbit-foundation/python-editor-v3 Нас полностью устраивает его функционал. Однако нам нужна оттуда реализация только редактора кода. Т.е. по результатам работы от исполнителя мы хотим видеть реакт приложение, которое будет содержать в себе только этот редактор и состояние, которое будет хранить значение кода для него. Чтобы дальше мы уже занимались вопросом интеграции, а не тратили время на попытку разобраться в чужом коде.

Доработка и настройка сайта
Опубликован:
02.10.24 06:36
Бюджет:
30000 руб.~$374.49
Доработка редактора кода с поддержкой языка Python

В своем проекте предполагаю использовать редактор кода для Python. Сейчас мы применяем одно из готовых решений для React - CodeMirror (пакет "@uiw/react-codemirror"). Всё устраивает, но есть ряд вещей, требующих доработки. Самое принципиальное - это подсказки для методов объектов. Т.е. через точку, как в IDE. В идеале и для написанных классов. Также в CodeMirror не все базовые существующие функции, ключевые слова или операторы имеют автодополнение (напр. ) Не столько важно покрыть подсказку для каждого метода, сколько разобраться в том, как это делать. Возможно, через API CodeMirror. Я также пробовал использовать регулярные выражения, частично это работает, но вероятно моих знаний в них не хватает, чтобы покрыть самые разные случаи. Если есть другие предложения, например использовать другие решения, а не CodeMirror - это тоже решение проблемы.

Доработка и настройка сайта
Опубликован:
02.10.24 04:15
Бюджет:
6000 руб.~$74.9
WebApp кликер на подобии хомяка

Нужен разработчик который сможет создать WebApp кликер на python, не очень сложный в простом виде, просто функционал чтобы был и можно было продолжать обновлять

Скрипты и боты
Опубликован:
02.10.24 01:16
Бюджет:
10000 руб.~$124.83
Устранение незначительного количества ошибок

Нужен подручный как в Мики маусе, только в Full-stack разработке! Задача: устранение незначительного количества ошибок в многофункциональном проекте Требования: опыт разработки от 2 лет Стек: Python, Django, DRF, vk_api Бд: postgreSQL и Redis Пишите почему мы должны выбрать именно тебя!

Доработка и настройка сайта
Опубликован:
01.10.24 20:23
Бюджет:
60000 руб.~$748.98
Full-stack разработка

Нужен Full-stack разработчик для доработки многофункционального проекта. Т.е. сам проект полностью готов, однако есть некоторые небольшие задачи, которые нужно решить. Требования: опыт Back и Front разработки от 2 лет Стек: Python, Django, DRF, vk_api Бд: postgreSQL и Redis Прикрепляйте резюме к откликам! Выберем лучшего!

Доработка и настройка сайта
Опубликован:
01.10.24 20:15
Бюджет:
60000 руб.~$748.98

Текущая страница: 35

Всего страниц: 319