Большая модель Huawei наконец-то здесь, моя оценка: довольно шокирующая

Первоисточник: Плохой обзор

Источник изображения: сгенерировано Unbounded AI‌

Huawei, о которой всегда говорили, что она отстает в конкурсе крупномасштабных моделей, на этот раз наконец-то пришла со своими ребятами.

Нет, на вчерашней Huawei Developer Conference 2023 компания Huawei покрасовалась.

Почти трехчасовая пресс-конференция все еще унаследовала прошлый стиль солянки Huawei, который ослепил Шичао.

Тем не менее, подведение итогов на самом деле выдвигает на первый план тему: большая модель Pangu 3.0.

На самом деле, всего несколько дней назад, когда другие крупные модели еще сравнивали различные рейтинги, Pangu уникальным образом вошел в поле зрения каждого, полагаясь на золотую вывеску, сертифицированную ведущим мировым журналом Nature.

Говорят, что с добавлением большой модели Pangea скорость прогнозирования погоды увеличилась более чем в 10 000 раз, а результаты можно получить за несколько секунд.Где придет тайфун, когда он придет и когда он уйдет, он может дать вам ясное предсказание.

Самое главное, что его точность прогнозирования даже превосходит систему IFS Европейского метеорологического центра, которая известна как самая сильная в мире.Это первый продукт прогнозирования ИИ, который победил в традиционном численном прогнозировании.

Вы знаете, большинство предыдущих ИИ-прогнозов погоды разрабатывались на основе 2D-нейронных сетей, но погода слишком сложна, а 2D — это уж слишком.

Более того, предыдущая модель ИИ будет продолжать накапливать итерационные ошибки в процессе прогнозирования, что легко повлияет на точность результатов.

Поэтому методы прогнозирования ИИ не пользовались популярностью.

Метеорологическая крупномасштабная модель Pangu потрясающая. Они использовали трехмерную нейронную сеть под названием 3DEST для обработки метеорологических данных. Если 2D не может этого сделать, они могут использовать 3D.

Стратегия сетевого обучения и логических выводов 3DEST

Стремясь решить проблему ошибки итерации, модель также использует «стратегию иерархической агрегации во временной области», чтобы уменьшить ошибку итерации и повысить точность прогноза.

Хотя это слово звучит легко обмануть, на самом деле его очень легко понять.

Например, предыдущая модель прогнозирования погоды AI FourCastNet перед тайфуном делала прогноз на 6 часов вперед, и в течение этих 6 часов модель неоднократно вычисляла, когда придет тайфун.

Он может быть рассчитан для 5 часов для некоторого времени и для 4 с половиной часов для некоторого времени, и ошибка будет большой, если эти результаты сложить вместе.

Но большая метеорологическая модель Pangu придумала способ обучения 4 моделей с разными интервалами прогнозирования, одной итерацией в 1 час и одной итерацией в 3 часа, 6 часов и 24 часа.

Затем, в соответствии с конкретными требованиями прогноза погоды, выберите соответствующую модель для итерации.

Например, если мы хотим предсказать погоду на следующие 7 дней, пусть 24-часовая модель повторится 7 раз; прогнозирование на 20 часов означает 3 итерации 6-часовой модели + 2 итерации 1-часовой модели.

**Чем меньше итераций, тем меньше ошибка. **

Эта волна операций вывела прогнозирование погоды на новый уровень.

Тем не менее, некоторые друзья, возможно, начали бормотать.Все большие модели людей сгенерированы изображениями и текстами.Как Huawei стал прогнозом погоды?

Следует сказать, что эта модель Pangu действительно отличается от ChatGPT и Midjourney, с которыми мы уже сталкивались ранее.Они занимаются бизнесом в отрасли.

Проще говоря, это означает, что мы лично не используем модель Pangu.

Это не «заклятый враг» ChatGPT, которого все ожидают, но он нацелен на рынок To B, который обычно недоступен. **

Не будем говорить о сложности или нет, по крайней мере, ресурсы корпоративных клиентов, которые Huawei накопила за эти годы, действительно легко обналичиваются.

Более того, пресс-конференция Huawei на этот раз не только принесла безжалостную роль модели прогнозирования погоды.

Новых антибиотиков не открывали более 40 лет, а суперантибактериальный препарат Лекарство Х был найден, как только появилась молекулярная модель препарата Пангея, и цикл разработки препарата сократился с нескольких лет до нескольких месяцев, а исследования и разработки затраты сократились на 70%.

Большая модель шахты Пангу также может учитывать более 1000 процессов добычи угля, и только выбор чистого угля может увеличить коэффициент извлечения чистого угля на 0,1–0,2%.

Вы знаете, для углеобогатительной фабрики с годовой производительностью 10 миллионов тонн коксующегося угля каждое увеличение производительности чистого угля на 0,1% может увеличить годовую прибыль на 10 миллионов.

** Это все белые деньги. . . **

На самом деле, в дополнение к упомянутым выше прогнозам погоды, разработке лекарств и обогащению угля, модель Пангеи использовалась во многих отраслях промышленности.

На пресс-конференции Тянь Ци, главный научный сотрудник HUAWEI CLOUD AI, сказал, что проекты HUAWEI CLOUD AI были применены к более чем 1000 проектам, 30% из которых используются в основной производственной системе клиента, что повысило прибыльность клиентов в среднем на 18%.

Huawei может массово производить эти большие модели для различных отраслей благодаря трехуровневой архитектуре 5+N+X модели Huawei Pangu 3.0.

Именно эта структура позволяет Pangu быстро приземлиться в различных отраслях.

Почему ты это сказал?

Поскольку ИИ входит в отрасль, данные представляют собой серьезную трудность.

Чжан Пинган сказал на пресс-конференции: «Из-за сложности получения отраслевых данных и сложности объединения технологий с промышленностью внедрение крупных моделей в отрасли идет медленно».

**Пангу очень изобретателен, с помощью трехуровневой структуры 5+N+X напрямую разделил эту большую проблему на 3 маленькие проблемы, которые нужно решить. **

Прежде всего, пять больших моделей слоя L0 Пангу изучили сотни терабайт текстовых данных, таких как энциклопедические знания, литературные произведения, программные коды и миллиарды интернет-изображений с текстовыми метками.

Мы можем понять, что сначала пусть большие модели первого уровня L0 (пять основных больших моделей: большая модель естественного языка, визуальная большая модель, мультимодальная большая модель, большая модель предсказания и большая модель научных вычислений) устанавливают базовое распознавание. немного похоже на этап качественного образования перед нашим университетом.

Затем модель второго слоя L1 формируется путем изучения данных N смежных отраслей из некоторой базовой большой модели в L0. Это похоже на этап бакалавриата в университете, где вам нужно выбрать множество специальностей для обучения.

Например, при проверке изображений КТ в больнице и при проверке качества изображений на заводе используются большие визуальные модели.

Но ведь одно - больница, а другое - фабрика, и сценарии использования совершенно разные.Опираться только на базовую крупную модель точно не получится, а если добавить отраслевые данные, то могут быть сюрпризы.

Последний L2 похож на аспирантов и будет дорабатываться до определенной сцены на основе конкретных отраслей. Например, в сфере складирования и логистики могут потребоваться разные модели развертывания для транспортировки, складирования и отгрузки товаров.

При этом Huawei также добавила ссылку для обратной связи, что немного похоже на стажировку в компании.

По их словам, в прошлом на разработку отраслевой модели в масштабе GPT-3 обычно уходило 5 месяцев, с этим набором инструментов цикл разработки можно сократить до 1/5 от первоначального.

В то же время ограничения небольших наборов данных во многих отраслях также могут быть устранены. Например, очень детализированная отрасль, такая как производство больших самолетов, также может иметь большие модели.

В дополнение к этому набору больших моделей Huawei также предложила очень интересную на этот раз вещь — локализацию вычислительных мощностей.

Как мы все знаем, мы действительно смущены вычислительной мощностью ИИ.

Во-первых, мы не можем купить H100/A100 от Nvidia, основное оборудование индустрии искусственного интеллекта. Например, скорость передачи была сильно снижена.

В контексте большой модели, обучение которой занимает несколько месяцев, ее легко обогнать зарубежные аналоги с более мощной вычислительной мощностью.

И на этот раз, чтобы решить эту проблему, Huawei все-таки нанял настоящих парней.

Например, с точки зрения производительности на бумаге процессор Ascend 910 от Huawei уже лучше, чем A100 от Nvidia.

Однако на практике все же имеются некоторые пробелы. И A100 тоже не главное оружие Nvidia.

Тем не менее, Shengteng был признан многими друзьями. Huawei даже прямо заявила на пресс-конференции, что «вычислительная мощность половины крупных моделей Китая обеспечивается ими».

Конечно, яркие пятна вычислительной мощности Huawei на данный момент, скорее всего, связаны со всей программной экосистемой.

Например, согласно пресс-конференции, посчитайте AI Ascend Cloud Computing Power Base и вычислительную среду CANN. . . В других аспектах эффективность Huawei в обучении больших моделей в 1,1 раза выше, чем у основных графических процессоров в отрасли.

Также они разработали полный набор пакетов приложений для пользователей.

Например, Meitu перенесла 70 моделей в экосистему Huawei всего за 30 дней. В то же время Huawei также заявила, что ** благодаря усилиям обеих сторон производительность ИИ улучшилась на 30% по сравнению с исходным решением. **

Все еще довольно впечатляюще.

Более того, Huawei также сообщила, что сейчас у них почти 4 миллиона разработчиков, что соответствует экосистеме NVIDIA CUDA.

Этот ряд действий можно рассматривать как восполнение части недостатков. **

Вообще говоря, посмотрев пресс-конференцию Huawei, плохие обозреватели считают, что план Huawei в области ИИ очень глубок, и они уже начали задумываться над вопросом, «что на самом деле может нам дать ИИ».

В последние полгода, хотя индустрия ИИ и получила бурные аплодисменты, несколько смущает, когда она действительно падает до отраслевого уровня.

И это действие Huawei только подтвердило то, что сказал Жэнь Чжэнфэй:

** «В будущем произойдет всплеск крупных моделей ИИ, а не только Microsoft. Прямой вклад компаний, занимающихся программными платформами искусственного интеллекта, в человеческое общество может составлять менее 2%, а 98% — это продвижение индустриального общества и сельскохозяйственное общество."* *

В области ИИ настоящая большая эра еще впереди.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить