Ключевые факты
- OpenAI просит контракторных сотрудников загрузить проекты из прошлых работ.
- Цель — оценить производительность агентов ИИ для офисной работы.
- Контракторы обязаны удалять конфиденциальную и личную информацию.
Краткая сводка
OpenAI в настоящее время просит своих контракторных сотрудников загрузить проекты из прошлых работ, чтобы помочь оценить производительность агентов ИИ. Эта инициатива предназначена для подготовки агентов ИИ к сложной офисной работе, предоставляя им реальные примеры профессиональных задач и результатов.
Однако компания возлагает ответственность за защиту данных прямо на самих контракторов. Согласно предоставленным инструкциям, контракторы должны удалять любую конфиденциальную информацию и личные данные (PII) из документов перед их загрузкой. Этот подход позволяет OpenAI собирать разнообразные обучающие данные, пытаясь снизить риски для конфиденциальности, хотя он во многом зависит от добросовестности сотрудников для обеспечения защиты чувствительных данных.
Новая инициатива по сбору данных
OpenAI направила специальный запрос своим контракторным сотрудникам по поводу использования данных. Компания просит этих людей предоставить рабочие проекты, которые они завершили в ходе предыдущей работы. Основная цель этого сбора — использовать данные для оценки того, насколько хорошо агенты ИИ справляются с задачами, обычно встречающимися в офисной среде.
Этот шаг представляет собой стратегический сдвиг в том, как приобретаются обучающие данные. Вместо того чтобы полагаться исключительно на общедоступные данные или синтетические наборы данных, компания ищет подлинные, созданные человеком рабочие продукты. Эти примеры предназначены для использования в качестве эталонов для оценки возможностей ИИ в профессиональных условиях.
Ответственность контракторов за конфиденциальность
Эта инициатива сопровождается строгим набором правил, касающихся конфиденциальности данных. OpenAI не очищает эти документы вручную; вместо этого задача возлагается на контракторов. Им поручено просмотреть свою прошлую работу и удалить любые чувствительные детали перед отправкой.
В частности, контракторы должны гарантировать, что удалены два типа данных:
- Конфиденциальная информация: Любые собственные бизнес-данные, коммерческие тайны или непубличная информация, принадлежащая предыдущим работодателям.
- Личные данные (PII): Любые данные, которые могут идентифицировать конкретных лиц, такие как имена, адреса или контактные данные.
Этот метод перекладывает бремя очистки данных на частное лицо, полагаясь на его суждения для защиты конфиденциальности третьих сторон.
Последствия для разработки ИИ
Используя реальные офисные проекты, OpenAI стремится преодолеть разрыв между теоретическими возможностями ИИ и практическим применением. Офисная работа часто включает в себя нюансы коммуникации, сложное форматирование документов и отраслевые знания, которых может не хватать в стандартных наборах данных.
Доступ к широкому спектру прошлых рабочих проектов мог бы значительно повысить способность агента ИИ справляться с разнообразными профессиональными сценариями. Однако зависимость от данных, отфильтрованных контракторами, вносит потенциальные переменные в качество данных и соответствие требованиям конфиденциальности. Успех этого метода обучения зависит от тщательности работы контракторов по удалению чувствительного контента.
Заключение
Запрос OpenAI к контракторным сотрудникам загрузить прошлые работы подчеркивает текущие проблемы в приобретении обучающих данных для ИИ. По мере роста спроса на высококачественные реальные данные отрасль видит новые методы поиска этой информации.
Этот подход сбалансирован между потребностью в надежных обучающих данных и соображениями конфиденциальности путем передачи процесса анонимизации на аутсорсинг. Остается неясным, насколько эффективным будет этот метод в подготовке агентов ИИ к сложностям современной рабочей среды, но он сигнализирует о продолжающейся эволюции в том, как строятся и оцениваются модели ИИ.



