Источник изображения: сгенерировано инструментом Unbounded AI
С 2023 года самым популярным словом в технологическом кругу является ChatGPT и стоящая за ним технология крупномасштабных моделей.
Ранее были Baidu Wenxin Yiyan, Alibaba Cloud Tongyi Qianwen, Huawei Pangu, HKUST Xunfei Xinghuo и т. д. Недавно Ли Кайфу вошел в бюро, чтобы создать Zero One Wanwu, а Volcano Engine запустил «Вулканический ковчег». Всего за несколько месяцев для различных предприятий стало тенденцией разрабатывать и выпускать крупномасштабные модельные приложения.
Существует более 80 отечественных крупномасштабных моделей со шкалой параметров от 1 миллиарда и более, и их число продолжает быстро расти. Атмосфера подготовки к коммерческой войне вокруг больших моделей уже чрезвычайно сильна.
Будь то большая компания-гигант или маленькая компания-гигант, всем им нужны такие действия, чтобы показать свою чувствительность к передовым технологиям и их долгосрочное накопление. Запустив приложение раньше, вы сможете протестировать ценные данные о взаимодействии большой модели и пользователя на день раньше, и «накопить много еды, а картинка — король» в будущем конкурсе.
Ключом к большой модели являются элементы поля ИИ — алгоритмы, вычислительная мощность, данные и сценарии/приложения. Алгоритмы представляют собой стратегии, вычислительная мощность определяет верхний предел и устанавливает порог, а данные, равные военным пайкам, также символизируют различие между хорошим и плохим. В дополнение к трем элементам сцена/приложение представляет собой направление отправки войск.
«Война сотен моделей» вот-вот разразится.Сможет ли гигантская компания со всеми элементами превратиться в бесконечную инволюцию технологических возможностей? Смогут ли маленькие гиганты на вертикальной трассе закрепить свое лидирующее положение с помощью больших моделей? Кто из новых игроков, получающих билеты, может стать серьезным претендентом на доминирование в отрасли?
Общая крупномасштабная модель "водораздела прочности" еще не появилась
Игроки крупных моделей в основном делятся на три категории: одна — интернет (Baidu, Ali, Tencent и др.) и отраслевые гиганты (China Telecom и China Unicom и др.) Умные компании (SenseTime, Yuncong, Guangyuewai и др.) , и последняя категория – это научно-исследовательские институты, представленные Шанхайской лабораторией искусственного интеллекта, Фуданьским университетом, Харбинским технологическим институтом и др.
По общедоступным данным, на начало июля 2023 года в моей стране насчитывается более 80 масштабных моделей с параметрами выше 1 миллиарда, и они продолжают быстро увеличиваться. Чем больше моделей с таким количеством параметров, тем выше будет конкурсный порог.
Большинство крупномасштабных моделей, которые были выпущены до сих пор, являются крупномасштабными моделями общего назначения.Основных причин две: во-первых, конкуренция крупномасштабных моделей все еще неясна, и чисто технический уровень не расширился. разрыв между поколениями, и у участников отрасли есть возможность доминировать в мире; Ориентированная на приложения крупномасштабная модель для общественности еще не появилась, и отсутствует четкое руководство по направлению. До «момента чата GPT» появляется отечественная крупномасштабная модель, это одновременно активный и пассивный выбор для присоединения к крупномасштабной модели общего назначения.
Более того, весьма вероятно, что из области больших моделей появится новый гигант.
Чжоу Хунъи считает, что большие модели должны быть «универсальными», и только общее использование может войти в тысячи домашних хозяйств, расширить возможности сотен отраслей и возглавить новую революцию искусственного интеллекта.
Что осталось незавершенным, так это то, сколько инвестиций и сотрудничества требуется, чтобы стать лидером новой революции. Независимо от того, является ли большая модель голубым океаном или рынком красного океана, должна существовать экологическая структура, в которой большая рыба ведет, а маленькая рыба сотрудничает, однако водораздел между большой рыбой и мелкой рыбой еще не возник.
Судя по текущей ситуации, большую модель со шкалой в 1 миллиард параметров можно считать порогом входа, а большую модель со шкалой в 10 миллиардов параметров можно считать способной конкурировать в мире, но даже большая модель со шкалой в 100 миллиардов параметров далеко не лучшая.Лидящий уровень пыли.
Количество параметров не является подавляющей силой, определяющей ситуацию на поле боя.Такие факторы, как возможности планирования ресурсов, накопление долгосрочного опыта и крупные инвестиции в научные исследования, являются давними ключевыми различиями в соревновании крупномасштабных моделей.
Чтобы сравнить с Open AI, необходимо увидеть, что за взрывом Chat GPT стоит всесторонняя поддержка Microsoft в отношении данных, вычислительной мощности и огромных средств, так что она накопила много денег в будущем.
Масштабные модели — это отрасли долгосрочных инвестиций, что означает просто «сжигание денег». Накопление вычислительной мощности, алгоритмов и данных не достигается в одночасье.После того, как модель выпущена, она нуждается в повторных тренировках и гибких итерациях и, наконец, эволюционирует в «зрелое тело».
В реальной среде игрок большой модели руководствуется технологиями или прибылью? Open AI — самая известная в мире компания по производству крупномасштабных моделей, и даже с учетом взрывоопасного продукта Chat GPT ее коммерциализация все еще вызывает беспокойство. Как технологическая компания, рыночная стоимость которой приближается к 30 миллиардам долларов США, она окажется в центре волны ИИ в 2023 году. Доход Open AI пока не превышает 200 миллионов долларов США.
Первоначальные вложения — это только первоначальные затраты, а каждое последующее обучение требует реальных денег.Многие ли компании могут смириться с мизерным возвратом инвестиций в масштабном модельном конкурсе? Успех Chat GPT доказывает, что большая модель открылась на пути продукта, но это не означает большого успеха на коммерческом уровне.
По крайней мере, по соотношению «затраты-выпуск» интернет-гиганты имеют большее относительное преимущество: у них достаточно мотивации и ресурсов, чтобы поддерживать стратегические потери на ранней стадии, как тогда было у Alibaba Cloud.
Что касается того, сколько времени потребуется, чтобы сжечь деньги и когда можно будет увидеть удовлетворительную отдачу от инвестиций, крупные компании не знают этого, равно как и венчурные капиталисты начинающих компаний. Это азартная игра, которая может выйти из игры в любой момент, а фишки составляют миллиарды долларов.
Для игроков крупномасштабных моделей, которые «у каждого есть свои преимущества», они должны сначала изучить прикладной уровень и открыть тест как можно скорее.Кто сможет накопить больше ценных данных о взаимодействии, станет переломным моментом в следующем соревновании.
Вертикальные потребности и вертикальные трудности
Конкуренция за общие крупномасштабные модели больше связана с конкуренцией за право формулировать инфраструктуру, в то время как вертикальная крупномасштабная модель опирается на крупномасштабные модели с открытым исходным кодом или интерфейсы API в конкретных сценариях для формирования дифференцированной конкурентоспособности в подразделенных отраслях. уделяя больше внимания применению сценариев.
На поле боя универсальных крупномасштабных моделей со временем некоторые слабые игроки будут постепенно отставать, и в итоге останется лишь несколько универсальных крупномасштабных моделей, которые будут играть роль инфраструктуры. . В то же время эти большие модели по-прежнему сталкиваются с проблемой однородности, а прикладной уровень по-прежнему зависит от вертикальных больших моделей.
Большая модель общего назначения похожа на набор нескольких вертикальных больших моделей. Чем больше сценариев обучения, тем сильнее «общность» большой модели общего назначения.
Как первая компания в Китае, выпустившая продукты, подобные Chat GPT, Baidu испытывает острую потребность в крупномасштабных модельных вертикальных слоях приложений. Ли Яньхун сказал: «Более важным, чем количество крупных моделей, является применение, которое является прорывом в применении вертикальных полей. Ключевым моментом новой стратегии международной конкуренции является не количество крупных моделей, а количество местных приложения на больших моделях. Эти приложения В какой степени была улучшена эффективность производства ».
Согласно метафоре Робина Ли, большие модели, особенно большие модели общего назначения, подобны операционной системе в эпоху ИИ.Все приложения будут разрабатываться вокруг большой модели, над которой находится прикладной уровень, включая различные нативные ИИ. Приложения.
В конечном счете, так называемая «универсальность» является лишь относительным понятием, и универсальной модели, полностью применимой ко всем отраслям и имеющей достаточную отраслевую глубину, не существует. Взяв в качестве примера Chat GPT, действительно широко используются некоторые отрасли с высоким уровнем отказоустойчивости.Даже если решение, данное большой моделью, неверно, ошибка ограничена относительно ограниченным диапазоном. Однако в таких сценариях, как тяжелая промышленность, аэрокосмическая промышленность и медицинское обслуживание, потери, вызванные ошибкой, неизмеримы, то есть Chat GPT не может соответствовать вертикальным и профессиональным требованиям конкретных сценариев.
Чтобы учесть требования вертикальности и профессионализма, данные — это недостаток, а отраслей с достаточной глубиной данных и стабильным рвом меньше. Трудно конкретно оценить, легко ли получить данные по этим отраслям и могут ли полученные данные соответствовать постоянно меняющимся требованиям конкретных отраслей.
Интернет-гиганты имеют большой объем сетевых данных, таких как электронная коммерция, социальные сети и поиск, но типы данных недостаточно полны, а качество данных не гарантируется. много горных работ.
В последнее время в сфере государственных дел, общественной безопасности и медицинского обслуживания одна за другой внедряются вертикальные крупномасштабные модели. Например, Yunzhisheng самостоятельно разработала крупномасштабную модель «гора и море» в области интеллектуального медицинского обслуживания в сочетании с полнофункциональными технологиями интеллектуального голосового взаимодействия, такими как предварительная обработка звуковых сигналов, распознавание голосовых отпечатков, распознавание речи и Синтез речи, как ожидается, повысит эффективность ввода электронных медицинских карт врачей более чем на 400%, сэкономив более 40% времени консультации для одного пациента и повысив эффективность работы врача в амбулаторных условиях более чем на 66%.
Основываясь на собственных официальных документах, директивных документах, руководствах по связям с государственными органами и других данных, таких как данные о профессиональной подготовке, TRS создала большую модель государственных дел.
В финансовой сфере Hang Seng Electronics приступит к планированию и разработке крупномасштабных финансовых моделей продуктов в конце марта 2023 года. В конце июня Hang Seng Electronics и ее дочерняя компания Hang Seng Juyuan выпустили новый финансовый продукт цифрового интеллекта, основанный на технологии больших языковых моделей, — финансовый интеллектуальный помощник Photon и дебют новой модернизированной интеллектуальной инвестиционной исследовательской платформы WarrenQ.
Tencent, интернет-гигант с многочисленными отраслевыми ресурсами, делает ставку на несколько сторон. В конце июня Tencent анонсировала сервисные решения MaaS, охватывающие 10 отраслей, включая финансы, культурный туризм, государственные дела и образование, всего более 50 решений.
В то же время данные, требуемые вертикальной крупной моделью, часто не ограничиваются отраслью.Некоторым предприятиям может потребоваться интеграция данных из другой или нескольких отраслей.Обучение и применение модели зависят от межотраслевого сотрудничества предприятий или ресурсов интернет-гигантов.
Во время золотой лихорадки на западе Соединенных Штатов в 19 веке было вероятностным событием, что золотоискатели действительно могли заработать деньги, в то время как то, что продавцы лопат, зарабатывали деньги, было неизбежным результатом.
В золотой лихорадке ИИ ситуация на поле боя большой модели все еще неясна, и игроки все еще продвигаются, но «продавец лопат» уже победил. Опираясь на тенденцию ИИ-чипов и больших моделей, Nvidia увеличила разрыв со своим конкурентом AMD, и ее рыночная стоимость вошла в «клуб триллионов долларов».
Генеральный директор Open AI Сэм Альтман предложил новую версию закона Мура, то есть вычислительная мощность глобального ИИ будет удваиваться каждые 18 месяцев. Для ведения этих расчетов требуется поддержка чипов для обучения ИИ, а доля рынка Nvidia в этой области превышает 90%.
Чипы Nvidia для искусственного интеллекта были раскуплены крупными технологическими компаниями по всему миру: в марте 2023 года Microsoft объявила, что помогла OpenAI построить новый вычислительный центр с десятками тысяч A100; в мае Google выпустила H100 с 26 000 штук. вычислительный кластер ComputeEngineA3. Кроме того, согласно информации China National Finance Securities, в этом году ByteDance заказала графические процессоры на сумму более 1 миллиарда долларов США, и, по оценкам, 100 000 штук A100 и H800 прибыли и не прибыли. Десятки тысяч чипов H800 также используются в новой версии Tencent Cloud High Performance Computing Service Center, выпущенной Tencent.
Финансовый директор Nvidia Кресс сказал, что текущий рыночный спрос на вычислительную мощность ИИ превысил ожидания компании на следующие несколько кварталов, и слишком много заказов нужно выполнить.
Конечно, нам бесполезно завидовать деньгам, которые зарабатывает Nvidia.
Внутренние графические процессоры также наверстывают упущенное: не только интернет-гиганты самостоятельно разработали ИИ-чипы, такие как ИИ-чип Baidu Kunlun, чип обработки видео Tencent «Canghai» и ИИ-чип «Zixiao» и т. д., но и Suiyuan Technology, Тяньшу Чжисинь, Новые компании, такие как Moore Threads, которые разрабатывают графические процессоры общего назначения. Графические процессоры общего назначения используются для различных задач общего назначения, включая возможности высокопараллельных вычислений и крупномасштабные вычислительные ядра. В последние годы также был достигнут большой прогресс. , а разрыв с высокопроизводительными графическими процессорами постепенно сокращается.
У Хэцюань, академик Китайской инженерной академии, предположил, что при координации национальной науки и техники и промышленных планов должно быть сформировано разумное разделение труда для формирования совместной вычислительной мощности, а платформа вычислительной мощности национальной должна быть открыта лаборатория для поддержки обучения различных крупномасштабных моделей.В то же время предлагается сформировать альянс вычислительных мощностей для концентрации существующих высокопроизводительных графических процессоров.Вычислительные ресурсы обеспечивают вычислительную мощность, необходимую для обучения данных больших моделей.
В дополнение к высокопроизводительным графическим процессорам новые рыночные возможности также рассматриваются как недорогие вычислительные платформы. Недавно Jiuzhang Yunji сообщила, что продолжит сотрудничество с государственными производителями облачных вычислений, включит на рынок большое количество интеллектуальных вычислительных центров в качестве партнеров и предоставит клиентам платформу для исследований и разработок модели искусственного интеллекта, которая объединяет программное и аппаратное обеспечение. стоимость заказчиков будет привязана к вычислительной мощности Безусловно.
Вычислительная мощность является основой для разработки больших моделей и является необходимым условием, но не достаточным условием.Максимальная роль, которую может играть вычислительная мощность, все еще зависит от направления использования. Только когда инновации алгоритмов, построение ресурсов данных и итерация обучающей среды идут рука об руку, можно создать «мощные летающие кирпичи».
Политика: руководство и регулирование в критические моменты
Период взрыва ИИ совпадает с критическим моментом управления алгоритмами и подачи алгоритмов в нашей стране.
Еще в 2021 году «Руководящие заключения по усилению комплексного управления алгоритмами информационных служб Интернета» определили управление файлами алгоритмов как важную часть совершенствования системы надзора. атрибуты общественного мнения или возможности социальной мобилизации должны выполнять процедуры подачи».
В апреле 2023 года Управление киберпространства Китая подготовило проект «Административных мер для генеративных услуг искусственного интеллекта (проект для комментариев)» для публичных консультаций. В июне «План законодательной работы Госсовета на 2023 год», опубликованный Госсоветом, показал, что проект закона об искусственном интеллекте подготовлен для внесения в Постоянный комитет Всекитайского собрания народных представителей для обсуждения.
В «Мерах управления услугами генеративного искусственного интеллекта (проект для комментариев)» упоминается, что перед использованием продуктов генеративного искусственного интеллекта для предоставления услуг населению об этом следует сообщить в государственную сеть в соответствии с «Положением об оценке безопасности информации в Интернете». Услуги с атрибутами общественного мнения или возможностями социальной мобилизации». Информационный отдел должен подать заявку на оценку безопасности и выполнить процедуры подачи, изменения и отмены алгоритмов в соответствии с «Правилами управления рекомендациями по алгоритмам информационных служб Интернета».
Это также является одной из причин, по которой нет общедоступных крупномасштабных модельных продуктов.
Профессор Чен Бин, заместитель декана юридического факультета Нанкайского университета и специальный исследователь Китайского научно-исследовательского института стратегии развития искусственного интеллекта нового поколения, считает, что предварительное регулирование не обязательно нанесет ущерб технологическим инновациям, но следует отметить, что из-за предшествующего обзор, это в определенной степени увеличит количество предприятий.Если объем предварительного обзора не установлен должным образом, это может снизить эффективность исследований, разработок и обучения генеративных продуктов ИИ и объективно привести к замедлению развития генеративный ИИ.
Поскольку риски искусственного интеллекта невозможно точно оценить заранее, а надзор после события может нанести огромный ущерб, моя страна в настоящее время принимает полный процесс надзора за развитием искусственного интеллекта.
При регулировании всего процесса стоимость соблюдения требований крупномасштабных игроков модели, несомненно, увеличится, и система регистрации записей также побуждает игроков в игре сначала добиваться регистрации записей, чтобы продвигать продукты на рынок раньше, объективно ускоряя скорость больших волн. Постепенное совершенствование законов и подзаконных актов сопровождается процессом перестановок в отрасли и отставанием слабых, что также может приблизить момент прояснения туч к солнцу.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
Когда родится новый гигант? Крупную модель ждет «водораздел»
Источник| Zero One Finance
Автор| Шэнь Чжоянь
С 2023 года самым популярным словом в технологическом кругу является ChatGPT и стоящая за ним технология крупномасштабных моделей.
Ранее были Baidu Wenxin Yiyan, Alibaba Cloud Tongyi Qianwen, Huawei Pangu, HKUST Xunfei Xinghuo и т. д. Недавно Ли Кайфу вошел в бюро, чтобы создать Zero One Wanwu, а Volcano Engine запустил «Вулканический ковчег». Всего за несколько месяцев для различных предприятий стало тенденцией разрабатывать и выпускать крупномасштабные модельные приложения.
Существует более 80 отечественных крупномасштабных моделей со шкалой параметров от 1 миллиарда и более, и их число продолжает быстро расти. Атмосфера подготовки к коммерческой войне вокруг больших моделей уже чрезвычайно сильна.
Будь то большая компания-гигант или маленькая компания-гигант, всем им нужны такие действия, чтобы показать свою чувствительность к передовым технологиям и их долгосрочное накопление. Запустив приложение раньше, вы сможете протестировать ценные данные о взаимодействии большой модели и пользователя на день раньше, и «накопить много еды, а картинка — король» в будущем конкурсе.
Ключом к большой модели являются элементы поля ИИ — алгоритмы, вычислительная мощность, данные и сценарии/приложения. Алгоритмы представляют собой стратегии, вычислительная мощность определяет верхний предел и устанавливает порог, а данные, равные военным пайкам, также символизируют различие между хорошим и плохим. В дополнение к трем элементам сцена/приложение представляет собой направление отправки войск.
«Война сотен моделей» вот-вот разразится.Сможет ли гигантская компания со всеми элементами превратиться в бесконечную инволюцию технологических возможностей? Смогут ли маленькие гиганты на вертикальной трассе закрепить свое лидирующее положение с помощью больших моделей? Кто из новых игроков, получающих билеты, может стать серьезным претендентом на доминирование в отрасли?
Общая крупномасштабная модель "водораздела прочности" еще не появилась
Игроки крупных моделей в основном делятся на три категории: одна — интернет (Baidu, Ali, Tencent и др.) и отраслевые гиганты (China Telecom и China Unicom и др.) Умные компании (SenseTime, Yuncong, Guangyuewai и др.) , и последняя категория – это научно-исследовательские институты, представленные Шанхайской лабораторией искусственного интеллекта, Фуданьским университетом, Харбинским технологическим институтом и др.
По общедоступным данным, на начало июля 2023 года в моей стране насчитывается более 80 масштабных моделей с параметрами выше 1 миллиарда, и они продолжают быстро увеличиваться. Чем больше моделей с таким количеством параметров, тем выше будет конкурсный порог.
Большинство крупномасштабных моделей, которые были выпущены до сих пор, являются крупномасштабными моделями общего назначения.Основных причин две: во-первых, конкуренция крупномасштабных моделей все еще неясна, и чисто технический уровень не расширился. разрыв между поколениями, и у участников отрасли есть возможность доминировать в мире; Ориентированная на приложения крупномасштабная модель для общественности еще не появилась, и отсутствует четкое руководство по направлению. До «момента чата GPT» появляется отечественная крупномасштабная модель, это одновременно активный и пассивный выбор для присоединения к крупномасштабной модели общего назначения.
Более того, весьма вероятно, что из области больших моделей появится новый гигант.
Чжоу Хунъи считает, что большие модели должны быть «универсальными», и только общее использование может войти в тысячи домашних хозяйств, расширить возможности сотен отраслей и возглавить новую революцию искусственного интеллекта.
Что осталось незавершенным, так это то, сколько инвестиций и сотрудничества требуется, чтобы стать лидером новой революции. Независимо от того, является ли большая модель голубым океаном или рынком красного океана, должна существовать экологическая структура, в которой большая рыба ведет, а маленькая рыба сотрудничает, однако водораздел между большой рыбой и мелкой рыбой еще не возник.
Судя по текущей ситуации, большую модель со шкалой в 1 миллиард параметров можно считать порогом входа, а большую модель со шкалой в 10 миллиардов параметров можно считать способной конкурировать в мире, но даже большая модель со шкалой в 100 миллиардов параметров далеко не лучшая.Лидящий уровень пыли.
Количество параметров не является подавляющей силой, определяющей ситуацию на поле боя.Такие факторы, как возможности планирования ресурсов, накопление долгосрочного опыта и крупные инвестиции в научные исследования, являются давними ключевыми различиями в соревновании крупномасштабных моделей.
Чтобы сравнить с Open AI, необходимо увидеть, что за взрывом Chat GPT стоит всесторонняя поддержка Microsoft в отношении данных, вычислительной мощности и огромных средств, так что она накопила много денег в будущем.
Масштабные модели — это отрасли долгосрочных инвестиций, что означает просто «сжигание денег». Накопление вычислительной мощности, алгоритмов и данных не достигается в одночасье.После того, как модель выпущена, она нуждается в повторных тренировках и гибких итерациях и, наконец, эволюционирует в «зрелое тело».
В реальной среде игрок большой модели руководствуется технологиями или прибылью? Open AI — самая известная в мире компания по производству крупномасштабных моделей, и даже с учетом взрывоопасного продукта Chat GPT ее коммерциализация все еще вызывает беспокойство. Как технологическая компания, рыночная стоимость которой приближается к 30 миллиардам долларов США, она окажется в центре волны ИИ в 2023 году. Доход Open AI пока не превышает 200 миллионов долларов США.
Первоначальные вложения — это только первоначальные затраты, а каждое последующее обучение требует реальных денег.Многие ли компании могут смириться с мизерным возвратом инвестиций в масштабном модельном конкурсе? Успех Chat GPT доказывает, что большая модель открылась на пути продукта, но это не означает большого успеха на коммерческом уровне.
По крайней мере, по соотношению «затраты-выпуск» интернет-гиганты имеют большее относительное преимущество: у них достаточно мотивации и ресурсов, чтобы поддерживать стратегические потери на ранней стадии, как тогда было у Alibaba Cloud.
Что касается того, сколько времени потребуется, чтобы сжечь деньги и когда можно будет увидеть удовлетворительную отдачу от инвестиций, крупные компании не знают этого, равно как и венчурные капиталисты начинающих компаний. Это азартная игра, которая может выйти из игры в любой момент, а фишки составляют миллиарды долларов.
Для игроков крупномасштабных моделей, которые «у каждого есть свои преимущества», они должны сначала изучить прикладной уровень и открыть тест как можно скорее.Кто сможет накопить больше ценных данных о взаимодействии, станет переломным моментом в следующем соревновании.
Вертикальные потребности и вертикальные трудности
Конкуренция за общие крупномасштабные модели больше связана с конкуренцией за право формулировать инфраструктуру, в то время как вертикальная крупномасштабная модель опирается на крупномасштабные модели с открытым исходным кодом или интерфейсы API в конкретных сценариях для формирования дифференцированной конкурентоспособности в подразделенных отраслях. уделяя больше внимания применению сценариев.
На поле боя универсальных крупномасштабных моделей со временем некоторые слабые игроки будут постепенно отставать, и в итоге останется лишь несколько универсальных крупномасштабных моделей, которые будут играть роль инфраструктуры. . В то же время эти большие модели по-прежнему сталкиваются с проблемой однородности, а прикладной уровень по-прежнему зависит от вертикальных больших моделей.
Большая модель общего назначения похожа на набор нескольких вертикальных больших моделей. Чем больше сценариев обучения, тем сильнее «общность» большой модели общего назначения.
Как первая компания в Китае, выпустившая продукты, подобные Chat GPT, Baidu испытывает острую потребность в крупномасштабных модельных вертикальных слоях приложений. Ли Яньхун сказал: «Более важным, чем количество крупных моделей, является применение, которое является прорывом в применении вертикальных полей. Ключевым моментом новой стратегии международной конкуренции является не количество крупных моделей, а количество местных приложения на больших моделях. Эти приложения В какой степени была улучшена эффективность производства ».
Согласно метафоре Робина Ли, большие модели, особенно большие модели общего назначения, подобны операционной системе в эпоху ИИ.Все приложения будут разрабатываться вокруг большой модели, над которой находится прикладной уровень, включая различные нативные ИИ. Приложения.
В конечном счете, так называемая «универсальность» является лишь относительным понятием, и универсальной модели, полностью применимой ко всем отраслям и имеющей достаточную отраслевую глубину, не существует. Взяв в качестве примера Chat GPT, действительно широко используются некоторые отрасли с высоким уровнем отказоустойчивости.Даже если решение, данное большой моделью, неверно, ошибка ограничена относительно ограниченным диапазоном. Однако в таких сценариях, как тяжелая промышленность, аэрокосмическая промышленность и медицинское обслуживание, потери, вызванные ошибкой, неизмеримы, то есть Chat GPT не может соответствовать вертикальным и профессиональным требованиям конкретных сценариев.
Чтобы учесть требования вертикальности и профессионализма, данные — это недостаток, а отраслей с достаточной глубиной данных и стабильным рвом меньше. Трудно конкретно оценить, легко ли получить данные по этим отраслям и могут ли полученные данные соответствовать постоянно меняющимся требованиям конкретных отраслей.
Интернет-гиганты имеют большой объем сетевых данных, таких как электронная коммерция, социальные сети и поиск, но типы данных недостаточно полны, а качество данных не гарантируется. много горных работ.
В последнее время в сфере государственных дел, общественной безопасности и медицинского обслуживания одна за другой внедряются вертикальные крупномасштабные модели. Например, Yunzhisheng самостоятельно разработала крупномасштабную модель «гора и море» в области интеллектуального медицинского обслуживания в сочетании с полнофункциональными технологиями интеллектуального голосового взаимодействия, такими как предварительная обработка звуковых сигналов, распознавание голосовых отпечатков, распознавание речи и Синтез речи, как ожидается, повысит эффективность ввода электронных медицинских карт врачей более чем на 400%, сэкономив более 40% времени консультации для одного пациента и повысив эффективность работы врача в амбулаторных условиях более чем на 66%.
Основываясь на собственных официальных документах, директивных документах, руководствах по связям с государственными органами и других данных, таких как данные о профессиональной подготовке, TRS создала большую модель государственных дел.
В финансовой сфере Hang Seng Electronics приступит к планированию и разработке крупномасштабных финансовых моделей продуктов в конце марта 2023 года. В конце июня Hang Seng Electronics и ее дочерняя компания Hang Seng Juyuan выпустили новый финансовый продукт цифрового интеллекта, основанный на технологии больших языковых моделей, — финансовый интеллектуальный помощник Photon и дебют новой модернизированной интеллектуальной инвестиционной исследовательской платформы WarrenQ.
Tencent, интернет-гигант с многочисленными отраслевыми ресурсами, делает ставку на несколько сторон. В конце июня Tencent анонсировала сервисные решения MaaS, охватывающие 10 отраслей, включая финансы, культурный туризм, государственные дела и образование, всего более 50 решений.
В то же время данные, требуемые вертикальной крупной моделью, часто не ограничиваются отраслью.Некоторым предприятиям может потребоваться интеграция данных из другой или нескольких отраслей.Обучение и применение модели зависят от межотраслевого сотрудничества предприятий или ресурсов интернет-гигантов.
**Вычислительная мощность: Мощные кирпичи летают? **
Во время золотой лихорадки на западе Соединенных Штатов в 19 веке было вероятностным событием, что золотоискатели действительно могли заработать деньги, в то время как то, что продавцы лопат, зарабатывали деньги, было неизбежным результатом.
В золотой лихорадке ИИ ситуация на поле боя большой модели все еще неясна, и игроки все еще продвигаются, но «продавец лопат» уже победил. Опираясь на тенденцию ИИ-чипов и больших моделей, Nvidia увеличила разрыв со своим конкурентом AMD, и ее рыночная стоимость вошла в «клуб триллионов долларов».
Генеральный директор Open AI Сэм Альтман предложил новую версию закона Мура, то есть вычислительная мощность глобального ИИ будет удваиваться каждые 18 месяцев. Для ведения этих расчетов требуется поддержка чипов для обучения ИИ, а доля рынка Nvidia в этой области превышает 90%.
Чипы Nvidia для искусственного интеллекта были раскуплены крупными технологическими компаниями по всему миру: в марте 2023 года Microsoft объявила, что помогла OpenAI построить новый вычислительный центр с десятками тысяч A100; в мае Google выпустила H100 с 26 000 штук. вычислительный кластер ComputeEngineA3. Кроме того, согласно информации China National Finance Securities, в этом году ByteDance заказала графические процессоры на сумму более 1 миллиарда долларов США, и, по оценкам, 100 000 штук A100 и H800 прибыли и не прибыли. Десятки тысяч чипов H800 также используются в новой версии Tencent Cloud High Performance Computing Service Center, выпущенной Tencent.
Финансовый директор Nvidia Кресс сказал, что текущий рыночный спрос на вычислительную мощность ИИ превысил ожидания компании на следующие несколько кварталов, и слишком много заказов нужно выполнить.
Конечно, нам бесполезно завидовать деньгам, которые зарабатывает Nvidia.
Внутренние графические процессоры также наверстывают упущенное: не только интернет-гиганты самостоятельно разработали ИИ-чипы, такие как ИИ-чип Baidu Kunlun, чип обработки видео Tencent «Canghai» и ИИ-чип «Zixiao» и т. д., но и Suiyuan Technology, Тяньшу Чжисинь, Новые компании, такие как Moore Threads, которые разрабатывают графические процессоры общего назначения. Графические процессоры общего назначения используются для различных задач общего назначения, включая возможности высокопараллельных вычислений и крупномасштабные вычислительные ядра. В последние годы также был достигнут большой прогресс. , а разрыв с высокопроизводительными графическими процессорами постепенно сокращается.
У Хэцюань, академик Китайской инженерной академии, предположил, что при координации национальной науки и техники и промышленных планов должно быть сформировано разумное разделение труда для формирования совместной вычислительной мощности, а платформа вычислительной мощности национальной должна быть открыта лаборатория для поддержки обучения различных крупномасштабных моделей.В то же время предлагается сформировать альянс вычислительных мощностей для концентрации существующих высокопроизводительных графических процессоров.Вычислительные ресурсы обеспечивают вычислительную мощность, необходимую для обучения данных больших моделей.
В дополнение к высокопроизводительным графическим процессорам новые рыночные возможности также рассматриваются как недорогие вычислительные платформы. Недавно Jiuzhang Yunji сообщила, что продолжит сотрудничество с государственными производителями облачных вычислений, включит на рынок большое количество интеллектуальных вычислительных центров в качестве партнеров и предоставит клиентам платформу для исследований и разработок модели искусственного интеллекта, которая объединяет программное и аппаратное обеспечение. стоимость заказчиков будет привязана к вычислительной мощности Безусловно.
Вычислительная мощность является основой для разработки больших моделей и является необходимым условием, но не достаточным условием.Максимальная роль, которую может играть вычислительная мощность, все еще зависит от направления использования. Только когда инновации алгоритмов, построение ресурсов данных и итерация обучающей среды идут рука об руку, можно создать «мощные летающие кирпичи».
Политика: руководство и регулирование в критические моменты
Период взрыва ИИ совпадает с критическим моментом управления алгоритмами и подачи алгоритмов в нашей стране.
Еще в 2021 году «Руководящие заключения по усилению комплексного управления алгоритмами информационных служб Интернета» определили управление файлами алгоритмов как важную часть совершенствования системы надзора. атрибуты общественного мнения или возможности социальной мобилизации должны выполнять процедуры подачи».
В апреле 2023 года Управление киберпространства Китая подготовило проект «Административных мер для генеративных услуг искусственного интеллекта (проект для комментариев)» для публичных консультаций. В июне «План законодательной работы Госсовета на 2023 год», опубликованный Госсоветом, показал, что проект закона об искусственном интеллекте подготовлен для внесения в Постоянный комитет Всекитайского собрания народных представителей для обсуждения.
В «Мерах управления услугами генеративного искусственного интеллекта (проект для комментариев)» упоминается, что перед использованием продуктов генеративного искусственного интеллекта для предоставления услуг населению об этом следует сообщить в государственную сеть в соответствии с «Положением об оценке безопасности информации в Интернете». Услуги с атрибутами общественного мнения или возможностями социальной мобилизации». Информационный отдел должен подать заявку на оценку безопасности и выполнить процедуры подачи, изменения и отмены алгоритмов в соответствии с «Правилами управления рекомендациями по алгоритмам информационных служб Интернета».
Это также является одной из причин, по которой нет общедоступных крупномасштабных модельных продуктов.
Профессор Чен Бин, заместитель декана юридического факультета Нанкайского университета и специальный исследователь Китайского научно-исследовательского института стратегии развития искусственного интеллекта нового поколения, считает, что предварительное регулирование не обязательно нанесет ущерб технологическим инновациям, но следует отметить, что из-за предшествующего обзор, это в определенной степени увеличит количество предприятий.Если объем предварительного обзора не установлен должным образом, это может снизить эффективность исследований, разработок и обучения генеративных продуктов ИИ и объективно привести к замедлению развития генеративный ИИ.
Поскольку риски искусственного интеллекта невозможно точно оценить заранее, а надзор после события может нанести огромный ущерб, моя страна в настоящее время принимает полный процесс надзора за развитием искусственного интеллекта.
При регулировании всего процесса стоимость соблюдения требований крупномасштабных игроков модели, несомненно, увеличится, и система регистрации записей также побуждает игроков в игре сначала добиваться регистрации записей, чтобы продвигать продукты на рынок раньше, объективно ускоряя скорость больших волн. Постепенное совершенствование законов и подзаконных актов сопровождается процессом перестановок в отрасли и отставанием слабых, что также может приблизить момент прояснения туч к солнцу.