Аннотация:— Данный академический обзор
систематизирует и анализирует прорывные подходы к
обучению больших языковых моделей, разработанные в
период 2022-2025 гг., с акцентом на радикальное
сокращение или полное исключение зависимости от
человечески размеченных данных. В работе детально
рассматриваются методологии, такие как обучение с
подкреплением на одном примере, парадигма полностью
автономного обучения "Абсолютный ноль", обучение "на
лету" во время тестирования, эффективное малопримерное
обучение, и самогенерация учебного плана через
декомпозицию задач. Анализируются ключевые
результаты этих подходов на стандартных бенчмарках,
обсуждаются эмерджентные когнитивные свойства
моделей, кросс-доменные эффекты, а также связанные с
этим риски и этические аспекты. Обзор предназначен для
студентов, преподавателей, исследователей и специалистов
в области искусственного интеллекта и обработки
естественного языка, стремящихся понять передний край
исследований в области эффективного обучения LLM.