В этом домашнем задании вы будете работать с корпусом Harry Potter and the Action Prediction Challenge. Корпус собран из фанфиков о Гарри Поттере и состоит из двух частей: 1) сырые тексты, 2) фрагменты текстов, описывающих ситуацию, в которой произнесено заклинание.Корпус описан в статье: https://arxiv.org/pdf/1905.11037.pdfDavid Vilares and Carlos Gómez-Rodríguez. Harry Potter and the Action Prediction Challenge from Natural Language. 2019 Annual Conference of the North American Chapter of the Association for Computational Linguistics. To appear.Код для сбора корпуса находится в репозитории: https://github.com/aghie/hpac . Корпус можно скачать по инструкции из этого репозитория, но для экономии времени авторы задания уже скачали и подготовили данные к работе.Ссылки на собранный корпус:Сырые тексты: Токенизированные тексты в нижнем регистре: train-test-dev: Части 1, 2 задания должны быть выполнены на полных текстах (сырых или предобработанных -- на ваше усмотрение), Часть 3 – на разбиение на тестовое, отладочное и обучающее множества. Тестовое множество должно быть использовано исключительно для тестирования моделей, обучающее и отладочное – для выбора модели и параметров.В статье и репозитории вы найдете идеи, которые помогут вам выполнить домашнее задание. Их стоит воспринимать как руководство к действию, и не стоит их копировать и переиспользовать. Обученные модели использовать не нужно, код для их обучения можно использовать как подсказку. ПРАВИЛА Домашнее задание выполняется индивидуально.Домашнее задание сдается в системе Anytask, куда можно попасть через инвайт.Домашнее задание оформляется в отчета в ipython-тетрадке.Отчет должен содержать: нумерацию заданий и пунктов, которые вы выполнили, код решения, и понятное пошаговое описание того, что вы сделали. Отчет должен быть написан в академическом стиле, без излишнего использования сленга и с соблюдением норм русского языка.Не стоит копировать фрагменты лекций, статей и Википедии в ваш отчет.Плагиат и любое недобросоветсное цитирование приводит к обнуление оценки. Часть 1. [1 балл] Эксплоративный анализ Найдите топ-1000 слов по частоте без учета стоп-слов.Найдите топ-10 по частоте: имен, пар имя + фамилия, пар вида ''профессор'' + имя / фамилия.[бонус] Постройте тематическую модель по корпусу HPAC.[бонус] Найдите еще что-то интересное в корпусе (что-то специфичное для фанфиков или фентези-тематики) Часть 2. [2 балла] Модели представления слов Обучите модель представления слов (word2vec, GloVe, fastText или любую другую) на материале корпуса HPAC.Продемонстрируйте, как работает поиск синонимов, ассоциаций, лишних слов в обученной модели.Визуализируйте топ-1000 слов по частоте без учета стоп-слов (п. 1.1) с помощью TSNE или UMAP (https://umap-learn.readthedocs.io). Часть 3. [6.5 баллов] Классификация текстов Задача классификации формулируется так: данный фрагмент фанфика описывают какую-то ситуацию, которая предшествует произнесению заклинания. Требуется по тексту предсказать, какое именно заклинание будет произнесено. Таким образом, заклинание - это фактически метка класса. Основная мера качества – macro 1. Обучите несколько классификаторов и сравните их между собой. Оцените качество классификаторов на частых и редких классах. Какие классы чаще всего оказываются перепутаны? Связаны ли ошибки со смыслом заклинаний?Используйте фрагменты из множества train для обучения, из множества dev для отладки, из множества test – для тестирования и получения итоговых результатов.[1 балл] Используйте fastText в качестве baseline-классификатора.[2 балла] Используйте сверточные сети в качестве более продвинутого классификатора. Поэкспериментируйте с количеством и размерностью фильтров, используйте разные размеры окон, попробуйте использовать -max pooling.[2 балла] Используйте рекуррентные сети в качестве альтернативного продвинутого классификатора. Поэкспериментируйте с количеством и размерностью слоев и другими гиперпараметрами.[1.5 балла] Попробуйте расширить обучающее множество за счет аугментации данных. Если вам понадобится словарь синонимов, можно использовать WordNet (ниже вы найдете примеры).[бонус] Используйте результат max pooling'а как эмбеддинг входного текста. Визуализируйте эмбеддинги 500-1000 предложений из обучающего множества и изучите свойства получившегося пространства.[бонус] Используйте ваш любимый классификатор и любые (честные) способы повышения качества классификации и получите macro 1 больше 0.5. Часть 4. [0.5 балла] Итоги Напишите краткое резюме проделанной работы. Читали ли вы сами Гарри Поттера или фанфики о нем и помогло ли вам знание предметной области в выполнении домашнего задания? Бонусная часть. [2 балла] Skip-Gram Negative Sampling Самостоятельно реализовать и обучить модель Skip-Gram Negative Sampling. Продемонстрировать качество полученных представлений на конкретный примерах.
Я пишу на python, selenium. Захожу на сайт, выполняю любые функции, но не могу при помощи данных инструментов решить капчу, а именно капчу-слайдер. Проблема заключается в прохождении ее, а именно капчи geetest_v3 / geetest_v4. С вашей стороны решение может быть каким угодно, не обязательно на python.У меня есть в голове есть два варианта решения, может у вас будет еще какой то:1. Графически (анализируется изображение, куда надо подвинуть слайдер, и двигается, нажать на кнопку подвинуть я могу, в этом случае от вас нужен шаг (расстояние) на какое двигается слайдер, так понимаю при помощи библиотек которые работают с изображениями, например openCV).2. Аналитически (через сервисы решения капчи - 2Captcha, RuCaptcha и прочее). Личный кабинет у меня есть, пополнен, могу выдать API-key, получить параметры для решения капчи я могу (ключ), но куда вставить его - непонятно. В таком случае с вас алгоритм который будет подставлять в нужное место ключ решения капчи.Любые свои наработки могу скинуть в лс.
Sites
Опубликован: 04.10.24 17:45
Бюджет: 5000 руб.~$62.42
Разработка комбайна для выгрузки видео в VK клипы
1. Описание проекта Создание программного обеспечения (комбайна) для автоматической выгрузки коротких и длинных видео из социальных сетей (TikTok, Instagram, YouTube) и публикации их в VK Клипах. Комбайн должен обеспечивать возможность выгрузки видео по различным параметрам (хештег, название, профиль) и предлагать удобные инструменты для сортировки и автоматической генерации заголовков видео. Для защиты ПО оно должно привязываться к жесткому диску покупателя. 2. Функциональные требования 2.1. Выгрузка видео Источники данных: TikTok, Instagram, YouTube.Параметры выгрузки:Поиск и выгрузка по хештегу.Поиск и выгрузка по названию видео.Выгрузка всех видео с конкретного профиля/аккаунта.Выгрузка большого объема данных: Возможность выгружать не менее 100 видео в день. 2.2. Публикация видео Целевая платформа: VK Клип.Автоматизация: Настройка на массовую загрузку видео. 2.3. Сортировка и классификация видео Возможность сортировать видео по тематикам (например, спорт, кулинария, путешествия и т.д.).Система тегов и меток для управления выгруженным контентом. 2.4. Автоматическая генерация названий Использование анализа содержимого для генерации заголовков роликов.Подбор ключевых слов из видео и описание содержания для создания уникальных заголовков. 3. Требования к безопасности и защите кода Привязка ПО к оборудованию пользователя: Использование серийного номера жесткого диска пользователя для генерации лицензии.Закрытие кода от пользователей: ПО должно быть защищено от доступа к исходному коду (например, упаковка в компилированный файл, шифрование). 4. Интерфейс пользователя Простой и интуитивный интерфейс для настройки выгрузки.Панель управления для сортировки, предварительного просмотра и публикации видео. 5. Технические требования Язык программирования: Python / Java (по согласованию).Платформы: Windows / MacOS.Зависимости и библиотеки: использовать только проверенные и обновляемые библиотеки для работы с API соцсетей. 6. Сроки и этапы выполнения Этап 1: Создание модуля для выгрузки видео из TikTok, Instagram, YouTube.Этап 2: Интеграция с VK Клипами и настройка массовой публикации.Этап 3: Реализация системы сортировки и генерации заголовков.Этап 4: Настройка защиты кода и привязки к оборудованию. 7. Тестирование и поддержка Проведение тестирования функциональности, устойчивости к изменениям API.Обеспечение поддержки для обновления функционала при изменениях в API социальных сетей.Телеграм для связи: @by_enjoyer
Desktop
Опубликован: 04.10.24 17:19
Бюджет: 30000 руб.~$374.49
Интеграция платёжной системы в Telegram бот [Python]
Здравствуйте! Нам нужен разработчик, который поможет интегрировать платёжную систему в Telegram-бот. Бот для продажи цифровых товаров, мы хотим, чтобы пользователи могли легко и быстро оплачивать свои покупки.
Что нужно сделать:
Тестирование:
Протестировать все функции в тестовом режиме, чтобы убедиться, что всё работает гладко.
Выбрать платёжную систему:
Подумайте, какая платёжная система лучше всего подойдёт. Если у вас есть идеи — делитесь!
Настроить API:
Получить необходимые ключи и подключить их к боту. Не забудьте настроить тестовый режим, чтобы всё проверить.
Добавить функционал:
Реализовать возможность создания платежа для каждого товара.
Сделать так, чтобы пользователи получали ссылку на оплату или форму для ввода данных.
Автоматически отправлять цифровые товары пользователям после успешной оплаты
Ожидаемый результат:
Мы хотим получить работающую версию бота с интегрированной платёжной системой, готовую к запуску.
Сроки:
Постарайтесь завершить работу в течение 1недели.
Дополнительно:
Будем рады увидеть ваши примеры работ с платёжными системами и любые интересные проекты, которые вы делали. Ждём ваших предложений!
Скрипты и боты
Опубликован: 04.10.24 16:21
Бюджет: 60000 руб.~$748.98
Валидация онлайн-казино на python
Есть маршрут, куда провайдер стучится со своими запросами и проверяет наши реакции. Есть документация, которой эти реакции должны соответствовать. Запросы вроде простые, но в логах провайдера не могу разобраться, python не мой родной язык. Валидацию пока проваливаемпишите @volodzya13
Backend
Опубликован: 04.10.24 15:59
Бюджет: 5000 руб.~$62.42
Сайт для совместного кодинга
Разработать платформу для совместного кодинга на ЯП PythonСуть простая: несколько пользователей по инвайт ссылке могут писать код и он засинхронен, также они могут его компилировать. Более подробно в ЛС.Указывайте свою стоимость!)
Backend
Опубликован: 04.10.24 15:44
Бюджет: 20000 руб.~$249.66
Сайт для совместного кодинга
Разработать платформу для совместного кодинга на ЯП Python
Суть простая: несколько пользователей по инвайт ссылке могут писать код и он засинхронен, также они могут его компилировать.
Более подробно в ЛС.
Указывайте свою стоимость!)
Создание сайта
Опубликован: 04.10.24 15:43
Бюджет: 40000 руб.~$499.32
Решение ошибок
Нужен сильный Backend-разработчики для решения задачи в высоконагруженном и многофункциональном сервисе.
Задача:
1. Устранить ошибку, связанную с авторизацией VK.ID
Стек: Python, Django
Дедлайн: 14 дней
Доработка и настройка сайта
Опубликован: 04.10.24 15:16
Бюджет: 60000 руб.~$748.98
Доработка Python-скрипта и настройка DevOps
Требования:
* Опыт работы с Python для разработки и доработки скриптов (разработчик уровня мидл или выше).
* Умение взаимодействовать с API, желательно с Dryad API, глубокий опыт работы с REST API, включая batch-запросы и тестирование.
* Опыт настройки DevOps-инфраструктуры (GitHub/GitLab/Azure DevOps), включая автоматизацию пайплайнов и триггеров.
* Навыки создания CI/CD пайплайнов для автоматизации тестирования и деплоя.
* Опыт работы с различными источниками данных и их мэппинга в унифицированные форматы (например, JSON).
* Опыт написания юнит-тестов с покрытием не менее 80% и настройки тестовых прогонов.
* Владение системами контроля версий (Git), включая работу в команде через GitHub/GitLab/Azure DevOps.
* Английский на уровне, достаточном для работы с документацией.
Задачи:
1. Доработка Python-скрипта:
Добавить функционал генерации контента на основе исследований (промпт готов нужно лишь доработать скрипт).
Интеграция API Dryad.
Обеспечить корректную работу и предоставить тестовые результаты.
2. Настройка DevOps:
Выбрать платформу (GitHub, GitLab, Azure DevOps).
Настроить и протестировать CI/CD пайплайн для автоматической сборки и тестирования.
3. Тестирование:
Провести юнит-тесты с покрытием кода 80%.
Выполнить анализ 300 исследований через скрипт.
4. Поддержка и консультации:
Консультирование по вопросам интеграции и тестирования.
Предоставить инструкции по использованию.
Мы предлагаем: Полное ТЗ, быстрые консультации и обратную связь.
Скрипты и боты
Опубликован: 04.10.24 15:12
Бюджет: 140000 руб.~$1747.6
Бот для регистрации и сохранения картинок
Необходимо написать бота (думаю проще всего на python), который будет регистрироваться на сайте https://www.krea.ai/ (для регистрации нужно использовать временную почту gmail, на которую будет приходить код. Для этого можно использовать сервис https://www.mailticking.com/). Необходимо учесть, что на сайте krea.ai стоит защита cloudflare, которую необходимо обходить. После регистрации нужно перейти на страницу генерации картинок https://www.krea.ai/apps/image/flux, на ней нудно установить размер картинок 16:9 и ввести промпт (описание запроса для картинки), далее сервис сгенерирует 4 картинки и нужно будет выбрать верхнюю левую и сохранить ее. Папка куда сохранять должна указываться до запуска бота, также список промптов (запросов для генерации картинки) должен передаваться боту в текстовом файле, каждый с новой строки. Сервис позволяет сгененировать около 15 изображений бесплатно, после чего необходимо выйти и зарегистрироваться снова и продолжить генерировать изображения, пока в файле не закончатся промпты.
Скрипты и боты
Опубликован: 04.10.24 14:14
Бюджет: 3000 руб.~$37.45
Whatsapp bot на Python с админкой
Всем привет,подробное ТЗ поместил в прикрепленный файл . Если коротко :
whatsapp bot на python по приему заказов пиццы, с админкой . Так же можно добавить функцию бронирования столиков. БД - MYSQL или SQLlite.
Жду ваших предложений и вопросов.
Скрипты и боты
Опубликован: 04.10.24 12:33
Бюджет: 14000 руб.~$174.76
Перенос данных с TradingView в google таблицы
Python - перенос данных с TradingView в google таблицы.
Возможно понадобиться знание Pine Script.
Есть задача по уже готовому торговому индикатору на криптовалюты.
Индикатор на платформе TradingView.
Данные из индикатора переносить в гугл таблицу.
Пример работы индикатора во вложении.
Индикатор собирает данные по "кривой" курса криптовалют.
Выдаёт прогнозы по Росту или Падению цены.
Это всё в одинаковом формате идёт в виде "текстовых блоков".
Эти текстовые блоки по шаблону (на втором скриншоте) нужно переносить в гугл таблицу.
Уведомления в ТГ или в таблицу на сервере не подходят.
Скрипты и боты
Опубликован: 04.10.24 10:53
Бюджет: 15000 руб.~$187.25
Протестировать возможности виджетов Google Colab
Нужно протестировать возможности виджетов Google Colab (среда выполнения кода на Python).Документация https://ipywidgets.readthedocs.io/en/latest/exampl...Уже есть скрипт, который расшифровывает аудио/видео файл в текст через Whisper:https://colab.research.google.com/drive/1BMT_EySdV...Что требуется:1. Загружаю аудио/видео файл в Google Colab из Google диск или Яндекс Диск (уже реализовано).2. Расшифровываю аудио/видео файл в текст (уже реализовано).3. Вывести расшифровку в таблицу. Образец: https://docs.google.com/spreadsheets/d/1Zgjk5gvvwn... 4. Столбцы таблицы:- Удалить (удаляет строку из таблицы, возможность отмены удаления)- Интервал (текст)- Плеер (плеер => воспроизводит указанный фрагмент файла)- Участник (селект => выбор из ФИО которые задаются в коде)- Выбрать для образца (чек-бокс)- Текст расшифровки (расшифровка указанного фрагмента)5. Желательно добавить режимы для воспроизведения (настройку в коде).- Воспроизведение одного фрагмента- Воспроизведение всех фрагментов по очереди (начиная текущего)6. Добавить блок кода, после запуска которого будут выбраны все строки, в которых был установлен чек-бокс " Выбрать для образца ". За хорошо выполненное задание напишу положительный развернутый отзыв.Присылайте заявку, и укажите для контакта ваш телеграм.
Backend
Опубликован: 04.10.24 10:31
Бюджет: 2000 руб.~$24.97
Python Selenium
Помогите обойти SmartCaptcha by Yandex Cloud с использованием Python Selenium или другое решение
Подробности в тз.
Скрипты и боты
Опубликован: 04.10.24 10:02
Бюджет: 2000 руб.~$24.97
Обернуть Django проект в Docker и изолировать запуск Python-кода пользователя в отдельном контейнере
Есть Django проект, который на бэкенде выполняет проверку пользовательского Python-кода. При текущем выполнении кода возникают ошибки, которые приводят к нагрузке на сервере. Необходимо обернуть проект в Docker и изолировать выполнение пользовательского кода в отдельном контейнере, чтобы избежать этих проблем. Задачи:
1. Обернуть существующий Django проект в Docker
2. Изолировать запуск пользовательского Python-кода в отдельном контейнере
3. Обеспечить безопасность и производительность
Ожидаемый результат:
1. Django проект корректно работает в Docker-контейнере.
2. Пользовательский код выполняется в изолированном контейнере, перезапуск возможен без влияния на основной проект.
3. Документация по настройке и запуску проекта с Docker.
Backend
Опубликован: 04.10.24 09:00
Бюджет: 1200 руб.~$14.98
Графическое оформление соцсетей
Группа посвящена программированию на Python
Лого должно включать легко узнаваемое лого ЯП python, но при более стильном/красочном/яблочном оформлении
Нужна графика для оформления групп/профилей FB/IG/VK (с отличиями только по размеру), и рекламными баннерами
С исходниками
Маркетплейсы и соцсети
Опубликован: 03.10.24 20:13
Бюджет: 10000 руб.~$124.83
Нужен поиск клиентов
Здравствуйте, я веб-разработчик с 5-летним опытом работы с Python, HTML, CSS, JavaScript и SQL. Создаю веб-приложения, Telegram-ботов, делаю разные скрипты и парсеры. Хочу найти человека, который будет заниматься поиском потенциальных клиентов.
Человека, который располагает личным временем и имеет возможность мониторить платформы и чаты в поисках клиентов.
Все просто, Вы находите клиентов, я выполняю работу, финансы 50/50
Долгосрочное сотрудничество
Персональный помощник
Опубликован: 03.10.24 16:40
Бюджет: 20000 руб.~$249.66
Веб Морда для эксель файла
Проект: Веб-платформа для отображения прогресса и балансов по проектам клиентов.
Задача: Создать веб-приложение с авторизацией, где клиенты могут видеть прогресс и баланс по проектам. Данные будут поступать из ежедневного файла .txt с балансами проектов. Веб-морда должна отображать общий баланс и прогресс в виде графиков, а также детали по каждой строке.
Функциональность:
Авторизация: Экран логин/пароль, доступ к проектам клиента.
Главная страница:
Общий баланс по каждому проекту (6–10 проектов).
Графики прогресса.
Просмотр балансов по каждой строке.
Структура данных:
Данные из файла .txt с разделителем |.
Строка включает папку клиента, балансы проектов и дату.
Пример строки: C:/Blum00w22pr3y3cj | 43946 | 7265547 | 667 | 2407 | 10:1:2024.
Админ-функции: Загрузка файла через FTP или админ-панель, управление базой клиентов.
Графики: Прогресс каждого проекта на основе данных.
Требования:
Технические: HTML, CSS, JavaScript (React/Vue), Python (Flask/Django) или PHP. Возможность работы с базой данных.
Безопасность: Авторизация и доступ строго ограничены.
Сроки:
Рабочая версия: 1 неделя.
Полное завершение: до 4 недель.
Интерфейс: Простой, напоминающий Excel. Возможность переключения языка (русский/английский).
Создание сайта
Опубликован: 03.10.24 16:22
Бюджет: 60000 руб.~$748.98
Обучение модели детекции объектов в режиме реального времени (python)
Цель: Обучить модель для детекции объектов.Создание программы на языке Python, где подключаем готовую модель с объектами для детекции на видео в режиме реального времени (будет вестись трансляция с камеры телефона видеопотоком, который будет обрабатываться скриптом, и при нахождении конкретного объекта в видео будет передавать полученную информацию в телеграмм бот)Более подробную информацию можно получить в сообщениях, отправлю пример работы
Other
Опубликован: 03.10.24 12:35
Бюджет: 50000 руб.~$624.15
Разработка сервиса авторизации и профилем пользователя
Авторизация и регистрация пользователей.
Управление профилем пользователя.
Регистрация и авторизация:
Регистрация нового пользователя: принимает email, пароль, и выдает подтверждение.
Активация email: отправка ссылки для подтверждения (через Mock или заглушку).
Авторизация пользователя: логин по email и паролю с выдачей access_token и refresh_token (JWT).
Выход из системы (logout): инвалидировать текущий токен сессии.
Обновление access_token через refresh_token: для продления сессии.
Управление профилем пользователя:
Получение информации о пользователе: аватар, имя, email, номер телефона, адрес.
Обновление профиля пользователя: изменение имени, аватара, номера телефона, адреса.
Обновление пароля: изменение пароля по старому паролю или с помощью сброса.
Сброс пароля: отправка ссылки на email для изменения пароля.
Изменение email: изменение email с подтверждением нового адреса.
Удаление аккаунта: полное удаление профиля с базы данных.
Язык программирования: Python.
Фреймворк: Flask (предпочтительно) или FastAPI.
База данных: PostgreSQL.
ORM: SQLAlchemy (если используется Flask), иначе Pydantic + SQLModel.
Токены и безопасность: JWT для access и refresh токенов.
Хеширование паролей: библиотека bcrypt или argon2.
Валидация данных: Pydantic или Marshmallow.
Swagger-документация: авто-генерация документации по всем маршрутам API.
Контейнеризация: приложение должно быть упаковано в Docker-контейнер (Dockerfile).
Десктоп программирование
Опубликован: 03.10.24 10:37
Бюджет: 20000 руб.~$249.66
Нужен парсер с сайтов по ссылкам на Python
Нужен парсер с сайтов по ссылкам т.е мы загружаем список сайтов и парсим
Телефоны
Email
WhatsApp
Telegram
VK
Facebook
Instagram
На выходе хочется получить список сайтов на против которых указаны данные которые перечислили
Если нужны прокси или капча просьба реализовать. Прокси как обычные так и моб а капча RuCaptcha и ручной ввод.