Нещодавно, у міру розвитку технологій штучного інтелекту, попит у всіх сфер на високоякісні навчальні дані суттєво зріс. Babel Audio, проєкт у складі David AI Labs, спеціалізується на платформі проєктів зі збору аудіоданих і надає розробникам мультимодальні набори даних. Ця платформа залучає працівників на відстані по всьому світу до участі в аудіозаписах, тим самим просуваючи вдосконалення моделей синтезу та розпізнавання мовлення. Такий новий формат «AI-заробітків на підробітку» приносить ринку праці гнучкі можливості для доходу: погодинна оплата від 17 доларів США звучить вкрай привабливо, однак разом із цим такі бізнес-моделі також супроводжуються потенційними ризиками, пов’язаними з поступкою конфіденційності даних і браком гарантій працівникам.
Babel Audio та механізми основного бізнесу
За лише два роки існування David AI Labs фокусується на наданні мультимодальних наборів даних розробникам моделей. Проєкт Babel Audio у його складі переважно збирає природні аудіодані через краудсорсингове аутсорсинг-делегування: він поєднує анонімних незнайомців для запису діалогів і пакує ці записи як навчальні дані, які використовують компанії зі штучного інтелекту. Учасникам не потрібно мати глибоку технічну підготовку: достатньо під’єднатися віддалено й, відповідно до інструкцій, виконувати діалогові записи або системну оцінку. Згідно з повідомленням Bloomberg, після того як користувач подає короткий аудіофрагмент, можна почати реєстрацію проєкту вже після початкового відбору; стартова ставка — 17 доларів США за годину. Якість записів оцінюють залежно від якості аудіо та низки інших факторів; що вищий бал, то більшу винагороду отримує користувач, а також можна подати заявку на проєкти з вищою оплатою. Її ключова мета — заповнити технологічний вакуум в AI щодо розуміння інтонацій і контексту завдяки реальній взаємодії між людьми.
Макромотивація економіки AI-заробітків на підробітку
Тренування машин через розмови з людьми — ще одна особлива робота, яку спричинила епоха штучного інтелекту, і попит на неї дуже високий. Якщо дивитися з макроекономічної перспективи, зростання Babel Audio відображає структурне розширення ринку розмітки даних (Data Annotation). Нині великі мовні моделі та технології синтезу мовлення значною мірою покладаються на «навчання з підкріпленням за участі людини (RLHF)», щоб гарантувати, що результати узгоджуються з логікою та нормами людей. Щоб контролювати колосальні витрати на розробку, технологічні компанії розподіляють розмітку робіт по глобальній системі економіки гіг-праці. Завдяки такому підходу компанії можуть за нижчою вартістю отримувати масиви даних і водночас забезпечувати їх різноманітність у межах різних регіонів.
AI-заробіток на підробітку? Вплив на ринок праці та учасників
Нульові роботи з навчання мовлення на AI дають населенню дуже гнучкий варіант підробітку, який добре підходить для тих, хто шукає віддалену роботу. Однак такі трудові відносини є підрядними за своєю природою, тож учасники не можуть користуватися пільгами на кшталт медичного страхування або вихідної допомоги, які передбачені традиційними трудовими нормами. Крім того, платформа значною мірою покладається на непрозорі алгоритми для оцінювання якості виконаної роботи та розподілу завдань. Учасники ризикують без попередження втрачати право брати замовлення через можливі зміни у тому, як систему вирішує, що вони виконали роботу; це демонструє притаманний економіці гіг-праці недолік щодо стабільності доходів.
Міркування щодо конфіденційності та прав на біометричні ознаки
Тренери з аудіо для штучного інтелекту також часто стикаються із проблемами виживання, пов’язаними з особистою конфіденційністю: чи вони, заради навчання технології, яка потенційно може замінити багато інших джерел їхнього існування, готові віддати надто багато — свої голоси та історії життя.
Під час участі в проєктах зі звукових даних на кшталт Babel Audio ключовим питанням є передача прав на конфіденційність. Згідно зі звичайними договорами таких платформ, працівники зазвичай мають погодитися надати платформі безстрокове та глобальне право використання біометричних даних, зокрема їхніх голосових відбитків (Voiceprint). Це означає, що компанії можуть використовувати дані для комерційного навчання або для створення мовних моделей і не потрібно платити подальші роялті. На тлі тенденції до дедалі суворішого законодавчого регулювання захисту даних учасникам, отримуючи короткострокову винагороду, потрібно обережно оцінювати потенційні ризики того, що їхні біометричні дані широко застосовуватимуть.
Що це за Babel Audio — «заробітки на підробітку разом із хвилею AI»: чат дає змогу заробити погодинну оплату 17 доларів США? Вперше з’явилося в Ланцюжок новин ABMedia.