Влияние умственного утомления, монотонности задач и перекоса данных на эффективность аннотаторов
Введение
Существует две темы, о которых редко говорят, когда речь заходит об аннотировании данных.
Во‑первых, аннотаторы — это не просто «инструменты», которые нужно обучать и чью работу следует неустанно контролировать; это обычные люди, такие же, как мы с вами: они могут уставать или отвлекаться.
Во‑вторых, на их работу влияет сам набор данных, который мы им предлагаем.
Я испытываю сострадание и глубокое уважение к аннотаторам, с которыми работаю каждый день, поэтому давно хотел затронуть эту тему, но не находил времени и ресурсов для полноценного исследования. С помощью ИИ и благодаря учёным, уже проделавшим основную работу, я могу хотя бы поделиться кратким обзором.
Я перечитал сгенерированный текст и убедился, что он выражает именно то, что хотел сказать.
Если вам лень читать, можно послушать:
Введение: ключевая роль аннотирования данных и влияние человеческого фактора
Аннотирование данных является краеугольным камнем при разработке и внедрении моделей искусственного интеллекта (ИИ) и машинного обучения (МО).1 Этот процесс, заключающийся в разметке сырых данных, делает их понятными для алгоритмов и критически важен для обучения моделей, способных точно распознавать шаблоны, делать предсказания и извлекать инсайты. Качество аннотаций напрямую определяет точность, надёжность и итоговую эффективность систем ИИ и МО.1 Плохая разметка, напротив, вводит предвзятость, снижает точность и ведёт к пустой трате ресурсов.1
Хотя внимание часто сосредоточено на алгоритмической стороне, человеческий фактор играет незаменимую роль.1 Когнитивное состояние аннотатора, характер выполняемых задач и свойства самих данных существенно влияют на качество и скорость разметки. Поэтому учёт этих факторов критически важен для оптимизации процессов и получения высококачественных обучающих выборок. Масштабирование ИИ‑проектов лишь усиливает необходимость поддерживать целостность и надёжность аннотаций.1
Определение проблем
Умственное утомление при когнитивных задачах: сущность и особенности
Умственное утомление — это психобиологическое состояние, возникающее при длительной умственной нагрузке.2 Оно характеризуется субъективным чувством усталости и нехваткой энергии.3 Даже 10‑минутные сложные задания могут вызвать утомление,4 влияя на последующие когнитивные и физические показатели.2 Симптомы включают сложности с концентрацией,5 забывчивость,5 рост числа ошибок5 и замедление работы.5 Возможны раздражительность, апатия, головные боли и проблемы с желудком.67
Важно отличать утомление от стресса: стресс вызывается угрозой и сопровождается гормональной реакцией «бей или беги», тогда как утомление — результат истощения умственных ресурсов.2 Нейрофизиологически оно связано с изменениями активности в передней поясной коре.8
Таблица 1. Симптомы умственного утомления
Симптом | Описание | Источник |
---|---|---|
Трудности с концентрацией | Снижение способности удерживать внимание. | 5 |
Забывчивость | Повышенная склонность к ошибкам памяти. | 5 |
Увеличение числа ошибок | Более частые промахи при выполнении заданий. | 5 |
Сложность удерживать фокус | Трудно долго следить за задачей, принимать решения, вести беседу. | 5 |
Удлинение времени выполнения | На привычные задания требуется больше времени. | 5 |
Снижение способности к решению задач | Сложнее мыслить критически и решать проблемы. | 5 |
Снижение креативности | Меньше новых идей и оригинальных решений. | 5 |
Лёгкая отвлекаемость | Повышенная чувствительность к внешним раздражителям. | 7 |
Проблемы с рабочей памятью | Трудности удерживать и манипулировать информацией в уме. | 7 |
Раздражительность | Лёгкая возбудимость и раздражение. | 7 |
Трудно завершать задачи | Ранее лёгкие задания даются тяжело. | 7 |
Ухудшение психического здоровья | Общее снижение благополучия. | 7 |
Сложность управлять эмоциями | Трудно адекватно регулировать чувства. | 7 |
Чувство опустошённости | Ощущение полного истощения ресурсов. | 7 |
Апатия | Отсутствие интереса и энтузиазма. | 7 |
Головные боли | Болевые ощущения в области головы. | 6 |
Желудочные проблемы | Дискомфорт или боли в животе. | 7 |
Снижение бодрствования | Меньшая бдительность и внимательность. | 9 |
Падение мотивации | Меньшее желание заниматься задачами. | 9 |
Вялость | Состояние сонливости и недостатка энергии. | 9 |
Трудность формулировать мысли | Сложно связно выражать идеи. | 9 |
Монотонные задачи: влияние на вовлечённость и результативность
Долгая работа с повторяющимися заданиями приводит к снижению внимания10, росту ошибок10 и падению мотивации.10 Монотонность вызывает скуку11, неудовлетворённость работой11 и даже проблемы со здоровьем.11 Парадоксально, но в начале производительность может расти из‑за снижения затрат на переключение контекста12; затем она стабилизируется или падает, а психологическая нагрузка возрастает.12 В задачах бдительности ухудшение точности и времени реакции может наступать уже через несколько минут.13
Перекос распределения данных: последствия для точности и согласованности
В реальных проектах данные часто несбалансированы: один класс значительно преобладает.14 Это усложняет обучение моделей и снижает качество разметки редких классов.15 Аннотаторам сложнее выработать уверенность в редких категориях, что ведёт к ошибкам и низкому межаннотаторному соглашению (IAA).16 При этом общая точность модели может вводить в заблуждение, так как отражает успех лишь на большинстве.17
Влияние на работу аннотаторов
Умственное утомление и точность классификации
Утомление снижает способность фильтровать лишнюю информацию, обрабатывать данные и удерживать внимание.2 С ростом усталости увеличивается число ошибок18 и время реакции.19 Даже при сознательном усилии удерживать уровень работы скрытые когнитивные процессы ухудшаются, что видно по изменениям ERP‑компонент N1 и P3.20
Повторяемость задач, ошибки и внимание
Монотонные задания быстро приводят к снижению бдительности и росту ошибок.10 Недостаток стимуляции вызывает «когнитивную недогрузку», когда система внимания переключается в пассивный режим.13 Введение большей вариативности или повышение сложности помогает смягчить эффект.21
Согласованность и предвзятость при перекосе данных
При сильном перекосе аннотаторы легко согласуются на большинстве, но расходятся на меньшинстве.16 Это ведёт к неустойчивой разметке и усилению смещений.15 Ошибки чаще встречаются в редких классах, а модели наследуют эти перекосы.22
Оценка влияния
- Умственное утомление: опросники (KSS), метрики реакции/точности, физиология (ЭЭГ, трекинг глаз), задачи типа антисакад.2
- Монотонность: рост ошибок, замедление реакции, субъективные отчёты о скуке, сравнение с более вариативными задачами.13
- Перекос данных: анализ IAA по классам, распределение ошибок, метрики precision/recall/F1 для каждого класса, сравнение на сбалансированных поднаборах.23
Стратегии смягчения и оптимизации
Борьба с умственным утомлением
- Регулярные перерывы.24
- Ротация задач и разнообразие.25
- Эргономичное рабочее место.26
- Поддержка здоровых привычек (сон, питание, спорт).[^\70]
- Корректировка формы подачи данных (размер, формат) при усталости.27
Снижение негативного эффекта монотонности
- Ротация и микротаски.25
- Геймификация и система поощрений.28
- Лёгкое повышение когнитивной сложности.21
- Чёткие гайдлайны, обратная связь и фильтры в инструментах.1525
- Автоматизация рутинных частей (AI‑ассист).29
Работа с перекошенными данными
- Сбалансированная выборка (over/undersampling).15
- Расширенные инструкции и примеры для меньшинства.1
- Генерация синтетических данных или аугментация.15
- Стоимостно‑чувствительное обучение и стратифицированная выборка.14
- Ансамблевые методы на этапе моделирования.14
Ясные инструкции и механизмы обратной связи
Подробные, иллюстрированные гайдлайны минимизируют разночтения.1 Регулярная обратная связь и обновление правил по итогам аудитов и анализа ошибок поддерживают качество.231
Автоматизация и AI‑инструменты
Предразметка простых случаев, выявление аномалий и активное обучение (active learning) повышают эффективность и снижают нагрузку на людей.1530
Рекомендации
- Проектируйте рабочие процессы с перерывами, ротацией и микротасками.
- Внедряйте систему контроля качества, метрики IAA и циклы обратной связи.
- Поддерживайте мотивацию через обучение, признание достижений и справедливую оплату.
Заключение: путь к высококачественной разметке через человеко‑центричный дизайн
Качество аннотаций критично для успеха ИИ‑систем и во многом определяется человеческими факторами: усталостью, монотонностью и перекосом данных. Комплексные стратегии, ориентированные на благополучие аннотаторов и сбалансированность данных, помогают минимизировать ошибки и создавать надёжные обучающие выборки.
Использованная литература
-
Avoiding Common Pitfalls in Data Annotation - Labelvisor, accessed April 11, 2025, https://www.labelvisor.com/avoiding-common-pitfalls-in-data-annotation/ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
-
Understanding mental fatigue and its detection: a comparative analysis of assessments and tools - PubMed Central, accessed April 11, 2025, https://pmc.ncbi.nlm.nih.gov/articles/PMC10460155/ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
-
pmc.ncbi.nlm.nih.gov, accessed April 11, 2025, https://pmc.ncbi.nlm.nih.gov/articles/PMC9786280/#:~:text=Mental%20fatigue%2C%20defined%20as%20a,et%20al.%2C%202009). ↩︎
-
Cognitive tasks elicit mental fatigue and impair subsequent physical …, accessed April 11, 2025, https://pmc.ncbi.nlm.nih.gov/articles/PMC9786280/ ↩︎
-
Cognitive fatigue: What it is, symptoms, and how to manage it - Medical News Today, accessed April 11, 2025, https://www.medicalnewstoday.com/articles/cognitive-fatigue ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
-
Effects of Mental Fatigue on Brain Activity and Cognitive Performance: A Magnetoencephalography Study - ResearchGate, accessed April 11, 2025, https://www.researchgate.net/publication/282892276_Effects_of_Mental_Fatigue_on_Brain_Activity_and_Cognitive_Performance_A_Magnetoencephalography_Study ↩︎ ↩︎
-
What is Cognitive Fatigue?, accessed April 11, 2025, https://acognitiveconnection.com/what-is-cognitive-fatigue/ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
-
Mental fatigue impairs physical performance in humans | Journal of Applied Physiology, accessed April 11, 2025, https://journals.physiology.org/doi/full/10.1152/japplphysiol.91324.2008 ↩︎
-
Mental Exhaustion: Definition, Causes, Symptoms, and Treatment - Healthline, accessed April 11, 2025, https://www.healthline.com/health/mental-exhaustion ↩︎ ↩︎ ↩︎ ↩︎
-
7 Human Error Statistics For 2025 - DocuClipper, accessed April 11, 2025, https://www.docuclipper.com/blog/human-error-statistics/ ↩︎ ↩︎ ↩︎ ↩︎
-
Repetitive Work: Contrast and Conflict - LSU Faculty Websites, accessed April 11, 2025, https://faculty.lsu.edu/bedeian/files/repretitive-work-contrast-and-conflict.pdf ↩︎ ↩︎ ↩︎
-
(PDF) Experimental evidence for the effects of task repetitiveness on mental strain and objective work performance - ResearchGate, accessed April 11, 2025, https://www.researchgate.net/publication/260412582_Experimental_evidence_for_the_effects_of_task_repetitiveness_on_mental_strain_and_objective_work_performance ↩︎ ↩︎
-
archive.acrs.org.au, accessed April 11, 2025, https://archive.acrs.org.au/files/arsrpe/RS060025.pdf ↩︎ ↩︎ ↩︎
-
Handling Imbalanced Data in Classification - Keylabs, accessed April 11, 2025, https://keylabs.ai/blog/handling-imbalanced-data-in-classification/ ↩︎ ↩︎ ↩︎
-
Top Challenges in Data Annotation And How To Overcome Them - Labellerr, accessed April 11, 2025, https://www.labellerr.com/blog/how-to-overcome-challenges-in-data-annotation/ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
-
Inter-Annotator Agreement: a key Labeling metric - Innovatiana, accessed April 11, 2025, https://en.innovatiana.com/post/inter-annotator-agreement ↩︎ ↩︎
-
Facing Imbalanced Data - Laszlo A. Jeni, accessed April 11, 2025, https://www.laszlojeni.com/pub/articles/Jeni13ACII.pdf ↩︎
-
Mental Fatigue: What Happens When Your Brain Is Tired? · Frontiers …, accessed April 11, 2025, https://kids.frontiersin.org/articles/10.3389/frym.2023.1080802 ↩︎
-
Examining the Landscape of Cognitive Fatigue Detection: A … - MDPI, accessed April 11, 2025, https://www.mdpi.com/2227-7080/12/3/38 ↩︎
-
Overt and Covert Effects of Mental Fatigue on Attention Networks: Evidence from Event-Related Potentials during the Attention Network Test - MDPI, accessed April 11, 2025, https://www.mdpi.com/2076-3425/14/8/803 ↩︎
-
Cognitive Engagement Combats Transport Workers’ Monotony, accessed April 11, 2025, https://ohsonline.com/articles/2012/08/30/cognitive-engagement-combats-transport-worker-monotony?m=1 ↩︎ ↩︎
-
Correcting Annotator Bias in Training Data: Population-Aligned Instance Replication (PAIR), accessed April 11, 2025, https://arxiv.org/html/2501.06826v2 ↩︎
-
Ensuring Quality in Data Annotation - Keymakr, accessed April 11, 2025, https://keymakr.com/blog/ensuring-quality-in-data-annotation/ ↩︎ ↩︎
-
Mental fatigue in cybersecurity defense - RangeForce, accessed April 11, 2025, https://www.rangeforce.com/blog/mental-fatigue-in-cybersecurity-defense ↩︎
-
10 Tips to Supercharge Your Data Labeling Efficiency | HumanSignal, accessed April 11, 2025, https://humansignal.com/blog/10-tips-to-supercharge-your-data-labeling-efficiency/ ↩︎ ↩︎ ↩︎
-
How Stressful/Tiring is Data Annotation Compared To a 9/5? - Reddit, accessed April 11, 2025, https://www.reddit.com/r/DataAnnotationTech/comments/1gkkrfp/how_stressfultiring_is_data_annotation_compared/ ↩︎
-
Cognitive Fatigue and Attention - Effects, Strategies, Scientific Insights - Taju Coaching, accessed April 11, 2025, https://www.tajucoaching.com/blog/cognitive-fatigue-and-attention-strategies-for-maintaining-focus-and-alertness ↩︎
-
Building Annotation Performance Dashboards | Keymakr, accessed April 11, 2025, https://keymakr.com/blog/building-annotation-performance-dashboards-for-continuous-improvement/ ↩︎
-
The Full Guide to Automated Data Annotation - Encord, accessed April 11, 2025, https://encord.com/blog/automated-data-annotation-guide/ ↩︎
-
Improving Data Quality With an Efficient Data Labeling Process - Dataiku blog, accessed April 11, 2025, https://blog.dataiku.com/improving-data-quality-with-an-efficient-data-labeling-process ↩︎