В этом домашнем задании вы будете работать с корпусом Harry Potter and the Action Prediction Challenge. Корпус собран из фанфиков о Гарри Поттере и состоит из двух частей: 1) сырые тексты, 2) фрагменты текстов, описывающих ситуацию, в которой произнесено заклинание.Корпус описан в статье: https://arxiv.org/pdf/1905.11037.pdfDavid Vilares and Carlos Gómez-Rodríguez. Harry Potter and the Action Prediction Challenge from Natural Language. 2019 Annual Conference of the North American Chapter of the Association for Computational Linguistics. To appear.Код для сбора корпуса находится в репозитории: https://github.com/aghie/hpac . Корпус можно скачать по инструкции из этого репозитория, но для экономии времени авторы задания уже скачали и подготовили данные к работе.Ссылки на собранный корпус:Сырые тексты: Токенизированные тексты в нижнем регистре: train-test-dev: Части 1, 2 задания должны быть выполнены на полных текстах (сырых или предобработанных -- на ваше усмотрение), Часть 3 – на разбиение на тестовое, отладочное и обучающее множества. Тестовое множество должно быть использовано исключительно для тестирования моделей, обучающее и отладочное – для выбора модели и параметров.В статье и репозитории вы найдете идеи, которые помогут вам выполнить домашнее задание. Их стоит воспринимать как руководство к действию, и не стоит их копировать и переиспользовать. Обученные модели использовать не нужно, код для их обучения можно использовать как подсказку. ПРАВИЛА Домашнее задание выполняется индивидуально.Домашнее задание сдается в системе Anytask, куда можно попасть через инвайт.Домашнее задание оформляется в отчета в ipython-тетрадке.Отчет должен содержать: нумерацию заданий и пунктов, которые вы выполнили, код решения, и понятное пошаговое описание того, что вы сделали. Отчет должен быть написан в академическом стиле, без излишнего использования сленга и с соблюдением норм русского языка.Не стоит копировать фрагменты лекций, статей и Википедии в ваш отчет.Плагиат и любое недобросоветсное цитирование приводит к обнуление оценки. Часть 1. [1 балл] Эксплоративный анализ Найдите топ-1000 слов по частоте без учета стоп-слов.Найдите топ-10 по частоте: имен, пар имя + фамилия, пар вида ''профессор'' + имя / фамилия.[бонус] Постройте тематическую модель по корпусу HPAC.[бонус] Найдите еще что-то интересное в корпусе (что-то специфичное для фанфиков или фентези-тематики) Часть 2. [2 балла] Модели представления слов Обучите модель представления слов (word2vec, GloVe, fastText или любую другую) на материале корпуса HPAC.Продемонстрируйте, как работает поиск синонимов, ассоциаций, лишних слов в обученной модели.Визуализируйте топ-1000 слов по частоте без учета стоп-слов (п. 1.1) с помощью TSNE или UMAP (https://umap-learn.readthedocs.io). Часть 3. [6.5 баллов] Классификация текстов Задача классификации формулируется так: данный фрагмент фанфика описывают какую-то ситуацию, которая предшествует произнесению заклинания. Требуется по тексту предсказать, какое именно заклинание будет произнесено. Таким образом, заклинание - это фактически метка класса. Основная мера качества – macro 1. Обучите несколько классификаторов и сравните их между собой. Оцените качество классификаторов на частых и редких классах. Какие классы чаще всего оказываются перепутаны? Связаны ли ошибки со смыслом заклинаний?Используйте фрагменты из множества train для обучения, из множества dev для отладки, из множества test – для тестирования и получения итоговых результатов.[1 балл] Используйте fastText в качестве baseline-классификатора.[2 балла] Используйте сверточные сети в качестве более продвинутого классификатора. Поэкспериментируйте с количеством и размерностью фильтров, используйте разные размеры окон, попробуйте использовать -max pooling.[2 балла] Используйте рекуррентные сети в качестве альтернативного продвинутого классификатора. Поэкспериментируйте с количеством и размерностью слоев и другими гиперпараметрами.[1.5 балла] Попробуйте расширить обучающее множество за счет аугментации данных. Если вам понадобится словарь синонимов, можно использовать WordNet (ниже вы найдете примеры).[бонус] Используйте результат max pooling'а как эмбеддинг входного текста. Визуализируйте эмбеддинги 500-1000 предложений из обучающего множества и изучите свойства получившегося пространства.[бонус] Используйте ваш любимый классификатор и любые (честные) способы повышения качества классификации и получите macro 1 больше 0.5. Часть 4. [0.5 балла] Итоги Напишите краткое резюме проделанной работы. Читали ли вы сами Гарри Поттера или фанфики о нем и помогло ли вам знание предметной области в выполнении домашнего задания? Бонусная часть. [2 балла] Skip-Gram Negative Sampling Самостоятельно реализовать и обучить модель Skip-Gram Negative Sampling. Продемонстрировать качество полученных представлений на конкретный примерах.
Telegram-бот уже создан на Python и запущен на хосте ознакомиться можно тут
@Dosia_Stiralka_bot.
Сейчас необходима доработка задания:
- ВЫВОД
Для этого бот должен уметь создавать специальные рандомные, случайные цифры.
Промокод данный должен содержать случайные цифры и айди пользователя.
Дополнения, которые я вижу это
Однократное использование: После того как пользователь отправит промокод и он будет использован, помечай его как "использован".
Если этот промокод придет еще раз, система откажет, так как код уже использован.
Промокод может иметь срок действия (например, 7 дней)
Если у вас есть опыт работы с Python и Telegram
АР!, будем рады сотрудничеству ! Пишите в лс проект интересный и будет развиваться
Скрипты и боты
Опубликован: 25.09.24 20:01
Бюджет: 6000 руб.~$74.9
Доработка приложения на Python
Необходимо доработать приложение фронтэнд JS(React.js+React Native) и бэкэнд python.Сброшу задачи по запросу. Буду ждать от вас оценку
Backend
Опубликован: 25.09.24 18:25
Бюджет: 10000 руб.~$124.83
Бот комментатор постов в тг на python
Задача: написать телеграм бота на python который будет брать из файла каналы тг, затем брать из др файла текст сообщения, далее переходить на канал, и в последнем посте на канале оставлять комментарий, затем брать из файла следующий канал и тоже самое делать.
Скрипты и боты
Опубликован: 25.09.24 18:03
Бюджет: 4000 руб.~$49.94
Парсер групп тг по ключевым словам на python
Доброго дня. Необходимо написать парсер групп телеграм по ключевым словам на python. Задача: бот авторизуется в телеграм, затем берет ключевое слово из файла, далее вбивает в поиск телеграм и там выводится список групп. Вот их нужно спарсить в отдельный файл ввиде ссылок на группы.
В стартап связанным с стриминговым сервисов + AI, требуется Python full stack разработчик с опытом работы не менее 5 лет, умеющего самостоятельно решать сложные задачи, связанными с высоконаруженными сервисами, и оптимизации скорости работы подобных историй.Внимательно…Не работаем со студиями, только с частниками.Оставляйте ссылку на Ваш Telegram, для связи.Отправляю ТЗ лично в телеграм, после этого созваниваемся с видео (обязательно) и обсуждаем проект с каждым индивидуально.Мошенники, сразу идёте мимо, не тратьте своё время.Предстоит: 1. Развернуть готовый фреймворкдля стриминга голосовых и видеосигналов на сервере (изи)2. Наладить максимальную скорость взаимодействия интегрирующихся по API сервисов для стриминга (фреймворк + 3 сервиса с API, документации доступны для изучения).3. Реализовать базовый веб-интерфейс, для управления сервисом на основе используемого фреймворка, в соответствии с ТЗ и продолжать дорабатывать в соответствии с этапами.Дедлайны:Развернуть фреймворк, 1 день.Наладить скорость работы, 5 дней.Реализовать проектв соответствии с ТЗ, до 7 дней. Если требуется, пишите первые - @evgeniymg, сразу с описанием что уже делали.
Backend
Опубликован: 25.09.24 17:11
Бюджет: 1000000 руб.~$12482.84
Исправить ошибку в парсере для ВК
Необходимо исправить работу скрипта. Все файлы лежат тут: https://disk.yandex.ru/d/Qu98bwWyOK8E0Q
Описание работы скрипта:
«Была ранее программа, написанная на BAS. Новая прога реализована на Python, она делает запрос на получение постов по вк апи, получает ответ и проверяет в содержимом наличие ссылки на постер. Сейчас она проверяет всего 1 ссылку и записывает данные в result. А на BAS была сделана проверка сразу большого количества ссылок и записи их в разные файлы. Соответственно сейчас необходимо протестировать скрипт на Python, найти ошибку и доработать, чтобы можно было обрабатывать сразу большого кол-ва ссылок и записи их в разные файлы»
Описание бд:
«В бд каждому паблику выдается значение state
0 - еще не взяли в работу
1 - в работе
2 - отработали
И получается когда грузим много пабликов, некоторые зависают на state 1 и крутят бесконечно. При том при всем паблики на которых парсинг встал, мы после отдельно прокручиваем в парсинге и они успешно проходят.»
Дополнительные комментарии к проблеме:
1) «думаю как вариант мб проблема в каком то токене, когда он выдает какую то определенную ошибку и из за этого уходит в бесконечный цикл - это догадка»
2) «Главное исправить не просто с игнорирование ошибки и выходом из цикла, а именно найти ошибку и исправить ее, если делать как бы как, парсинг будет часть постов не дособирать»
Скрипты и боты
Опубликован: 25.09.24 16:01
Бюджет: 2000 руб.~$24.97
Разработка бэкэнда на Python для образоват. платформы
Требуется разработка бэкэнда для образовательной платформы на Python. Примерное тз отправляю ниже
Курсы
1.Функции:
Создание курса
Обновление курса
Удаление курса
Покупка курса
Получение списка курсов
Получение информации о конкретном курсе
2.Сущности курса:
Описание курса
Цена
Авторы
Теги
Файлы
Чат (опционально)
Тайтл (название)
Тестирование
До 4 фотографий
Уроки
1.Функции:
Создание урока
Обновление урока
Удаление урока
Получение списка уроков
Получение информации о конкретном уроке
2.Сущности урока:
Чат (опционально)
Контент урока
Видео (например, YouTube)
Файлы
Тайтл
Переходы на следующий и предыдущий уроки
Пользователи
1.Функции:
Создание пользователя
Обновление данных пользователя
Удаление пользователя
Получение списка пользователей
Получение информации о конкретном пользователе
2.Роли пользователей:
User: может проходить курсы и уроки, общаться с учителем, покупать пакеты курсов, работать с расписанием.
Admin: Полный доступ. Может создавать и редактировать курсы, уроки, пользователей, взаимодействовать с расписанием.
Mentor: может проводить занятия с учениками, взаимодействовать с расписанием.
Логи
Функции: Получение логов.
Содержание логов: Время проведения уроков, вход и выход пользователей.
Календарь/Мероприятия
Функции:
Установка дат занятий (для ролей Admin и Mentor)
Возможность писать в чат и отслеживать уроки в контексте мероприятия
Редактирование занятия
Страница с чатом
Создание сайта
Опубликован: 25.09.24 14:37
Бюджет: 150000 руб.~$1872.43
Декомпиляция и расшифровка Delphi в Python
Сам код получилось декомпелировать через https://github.com/crypto2011/IDR, тут скорее проблема с расшифровкой из-за незнания синтаксиса
Описание Задачи:
Файл Exe - программа на Delphi которая принимает файл и на его основе создает таблицу.
Нужна функция получения этой таблицы на Python для более удобной работы
Все вводные вышлю выбранному кандидату! Срок - 5 дней
Студии к исполнению НЕ интересуют!
Юзабилити, тесты и помощь
Опубликован: 25.09.24 13:47
Бюджет: 8000 руб.~$99.87
Телеграм бот + скрипт
Регистрация пользователей, сбор статистики и автоматическое отключение пользователей в WireGuard с помощью Python и API
Возможно поможет данная статья: https://habr.com/ru/companies/ispmanager/articles/764290/
Скрипты и боты
Опубликован: 25.09.24 13:15
Бюджет: 20000 руб.~$249.66
Скрипт хранения истории переписки с GPT
Необходимо разработать скрипт, который эффективно управляет и хранит обширную историю переписки с GPT. Цель заключается в том, чтобы избежать необходимости отправлять всю историю каждый раз через API GPT, используя вместо этого локальное хранилище (например, хеш) для сохранения контекста. Необходимо оптимизировать взаимодействие с API GPT и снизить затраты на его использование. Проект фокусируется на хранении данных и тесно переплетён с GPT.
Возможно использовать разные наработки с github, наподобие этого https://github.com/openai/chatgpt-retrieval-plugin. Возможно есть другие варианты работы с api open.ai
Цель проекта:
Разработать скрипт, обеспечивающий хранение и управление большой историей переписки с GPT, с целью оптимизации использования API GPT путем минимизации объема передаваемых данных.
Требования к реализации:
- Язык программирования: предпочтительно Python или другой подходящий язык.
- Использование официального API GPT от OpenAI.
- Обеспечение безопасности хранения данных и предотвращение утечек информации.
- Документирование кода и предоставление инструкций по установке и использованию скрипта.
Скрипты и боты
Опубликован: 25.09.24 13:13
Бюджет: 80000 руб.~$998.63
Доработать сервис (Python + LLM)
Добавить новые функции в текущий проектПроект на phyton, интеграция с ИИ, все на сервере, все работает. Нужно дополнить, провести тесты функционала, исправить ошибки и упаковать все в докер. Подробности в диалоге. Важно: Опыт работы с phyton, ИИ, обязательно.Задача на 5-6 часов.
Scripts
Опубликован: 25.09.24 12:01
Бюджет: 7500 руб.~$93.63
Переписать скрипт с Polling на вебхуки
Есть скрипт на python aiogram, который запускает нескольких ботов с помощью Polling. Нужно переписать его на вебхуки и потом дать подробную консультацию - что есть что и как это работает.
Скрипты и боты
Опубликован: 25.09.24 09:02
Бюджет: 3000 руб.~$37.45
Чат-бот на python в тг
Задача: дать сотрудникам возможность редактировать pdf файлы.
1. Сотрудник заходит в бота.
2. Видит список доступных PDF файлов.
3. Выбирает файл.
4. Бот выдает ему по 1 полю, которые нужно заполнить. Например, "введите значение поля "цена". И так повторяется, пока все поля в этом файле не будут заполнены.
5. В конце файл скачивается на телефон.
Нужно будет сделать БД 1 с параметрами. В БД будет 3 поля:
параметр - price (к примеру)
название на русском - Цена
текст для бота - Введите значение поля Цена
Чтобы список появился в боте, нужно предусмотреть БД 2, в которую админ сможет загрузить PDF с параметрами из БД 1.
Звучит сложно, но я готова созвониться и объяснить, как это будет работать)
Скрипты и боты
Опубликован: 25.09.24 07:30
Бюджет: 40000 руб.~$499.32
Написать парсер
Необходимо сделать парсер на python с записью в базу данных, для телеграм бота ниже. Тз отправлю исполнителю.
Заказы со всех фриланс бирж, у тебя в телеграм! Бот ищет новые проекты по ключевым словам и присылает уведомления. https://t.me/Flassistbot
Скрипты и боты
Опубликован: 25.09.24 07:08
Бюджет: 7000 руб.~$87.38
Разработка телеграм бота Python
Необходимо разработать телеграм бот в виде веб приложения. Есть много готовых модулей с предыдущего проекта.
Необходимый Стек
Python, Django, Django Rest Framework, celery, redis, FastApi, Websocket, docker, Python threading, Pydantic.
Необходимо будет дальнейшая поддержка.
ТЗ скину в личку
Скрипты и боты
Опубликован: 25.09.24 06:14
Бюджет: 175000 руб.~$2184.5
Доработать готовый парсер на Python для сайта закупки гов
Доработать готовый парсер на Python для сайта закупки.говТехническое задание:1) Необходимо добавить в парсер поиска закупок еще один вариант поиска.2) Редактирование результата поиска перед сохранением (результат сохраняется в HTML)3) Добавление отдельной галочки что бы использовать proxy.4) Изменение результата сохранения.
Other
Опубликован: 25.09.24 03:07
Бюджет: 3000 руб.~$37.45
Бот биржа заданий в телеграм
Нужно написать бота на python, который будет выполнять роль биржи заданий, но без рекламодателей, он будет один - админ (может создавать и публиковать задания для исполнителей). Суть в том, что люди будут брать задания, им будет присылаться инструкция как выполнить задание и кнопка для завершения выполнения и прикрепления отчета (в сообщении прикрепить или написать необходимую информацию), после чего это все должно отправляться на модерацию. В то же время админ может посмотреть отчеты по созданному заданию и статистику по нему (сколько выполнено, сколько на выполнении). В случае отказа пользователя от задания, нужно накладывать штраф (уменьшать баланс на N-ое количество средств). Админ может одобрить отчет или отклонить
Подробное тз скину в лс, эта ошбщая идея бота
Скрипты и боты
Опубликован: 24.09.24 22:29
Бюджет: 10000 руб.~$124.83
Сделать скрипт-бот на Python (срочно!!)
Создать бота с админкой, где админ может:
1. Управлять пользователями: добавлять, удалять и задавать срок активации (часа, дни и т.д.).
1. Парсер чатов:
- Поиск чатов в Telegram по ключевым словам (с окончанием и без).
- Результаты в таблице Google: полное название, кол-во участников, ссылка, наличие заявок на вступление.
- Аналогичный поиск для каналов с сортировкой по количеству подписчиков (больше сверху, меньше снизу).
2. Комментинг в каналах:
- Публикация первого комментария, затем его изменение на рекламный (ссылка).
- Управление аккаунтами:
- Просмотр списка аккаунтов (папки: спам, в работе, удаленные).
- Возможность очистки всех папок.
- Список прокси с возможностью добавления и прикрепления к аккаунтам.
- Функция автоматического вступления в чаты/каналы по списку с формированием папок и сбором ссылок.
- Статистика по комментaм и аккаунтам (валидные, в работе, нерабочие, спам-блок).
3. Постер (рассылка по каналам):
- Система рассылки постов в каналы, где бот находится в адмuнах или без
- Возможность добавления токена бота, создания постов с текстом и изображениями или редактирования пересланных постов.
- Интуитивно понятный интерфейс админки.
- Высокая скорость обработки запросов.
- Наличие статистики по всем функциям.
подробнее и четкое ТЗ в ЛС!! Есть ещё функции которые тут в сообщении не уместились!!! бот в последующем на сервер нужно будет поставить
Скрипты и боты
Опубликован: 24.09.24 22:12
Бюджет: 5000 руб.~$62.42
Простой скрипт Telegram-бота на Python aiogram 3
Требуется написать простой скрипт Telegram-бота на Python aiogram 3, который будет:
1. Сохранять в БД sqlite сообщения от каждого пользователя: group_id, user_id, date, message, status (1 - опубликовано, 0 - удалено)
2. Сохранять в БД sqlite информацию о дате вступления/выхода и способ вступления пользователя в группу: group_id, user_id, date, join_type (invite_link, via_join_request, via_chat_folder_invite_link и т.д.), left_type (бан, самостоятельно)
3. Удалять сообщение пользователя в случае, если оно:
имеет длину более 10 символов
и
совпадает с предыдущим сообщением от этого же пользователя за последние 3 часа
4. Отправлять администратору бота уведомления о вступлении и выходе пользоватей во все группы, в которых состоит бот:
- (дата время), вступление (имя пользователя), (user_name), (user_id) в (название чата). Массив с информацией, передаваемой о способе вступления в группу (invite_link, via_join_request, via_chat_folder_invite_link и т.д.)
- (дата время), выход (имя пользователя), (user_name), (user_id) из (название чата).
Скрипты и боты
Опубликован: 24.09.24 20:11
Бюджет: 1000 руб.~$12.49
Подбор креативных метафор для градуировки цен и отзывов
Описание:
Необходимо подобрать оригинальные и креативные метафоры для трёх функций, которые используются в проекте на Python для обработки данных о играх. Эти метафоры должны быть максимально интересными, яркими и современными, чтобы их было приятно видеть в пользовательском интерфейсе (например, в Telegram-боте).
В зависимости от стоимости игры (в рублях) нужно подобрать метафоры, которые ассоциируются с определённой ценой. Примеры текущих метафор: "Как жвачка [:1f36c]", "Новая футболка [:1f455]", "День твоей работы [:1f6e0]".
Всего 16 диапазонов цен, от стоимости менее 30 рублей до более 2999 рублей.
Подбор метафор для описания процента положительных отзывов
Необходимо придумать креативные и современные метафоры для разных уровней процента положительных отзывов на игру. Примеры: "Абсолютный шедевр! [:1f3c6][:2728]", "50 на 50 [:2696][:1f937-200d-2642-fe0f]", "Полный провал! [:1f4a5][:1f198]".
Всего 11 диапазонов (от 0% до 100%).
Подбор метафор для описания популярности игры
Требуется подобрать метафоры для разных уровней популярности на основе общего количества отзывов. Примеры: "Легендарный феномен! [:1f31f][:1f451]", "Звезда на подъёме! [:2728][:1f680]", "Первая искра интереса! [:1f525][:2728]".
Всего 16 диапазонов (от 1 отзыва до более 1 миллиона).
Метафоры должны быть оригинальными, креативными, уместными для русскоязычной аудитории.
Желательно использование эмодзи для каждой метафоры.
Метафоры должны быть понятными и вызывать положительные эмоции у пользователя.