YandexGPT научится переводить текст с изображений и видео

«Яндекс» ищет переводчиков для обучения нейросети.

«Яндекс» научит свою нейросеть YandexGPT распознавать и переводить текст с изображений, аудио- и видеофайлов. Компания планирует нанять для этого около десятка AI-тренеров.

Специалист должен знать английский язык и обладать профессиональными навыками перевода, необходимыми для обучения больших языковых моделей. Тренеры будут обучать генеративную модель, создавая собственные эталонные примеры, оценивать качество перевода и учить нейросеть распознавать и переводить текст с изображений и видео. При этом речь идет об узкоспециализированных направлениях — от физики до юриспруденции, уточняет представитель «Яндекса».

Эксперты, опрошенные изданием, поясняют, что основная сложность заключается в том, что для обучения современных моделей переводчик должен произвести не дословный перевод, а собрать семантически близкие виды переводов. Поэтому в большинстве случаев сейчас нейросети делают дословный перевод.

«Яндекс» представил собственную нейросеть YandexGPT в мае 2023 года. Летом прошлого года она научилась запоминать контекст беседы и задавать уточняющие вопросы. Затем ее добавили в приложениие для генерации изображений «Шедеврум». В марте 2024 года компания представила третье поколение нейросетей YandexGPT, в том числе модель для бизнеса.


Источник: Sostav