* مصدر الصورة: تم إنشاؤه بواسطة أداة Unbounded AI *
منذ عام 2023 ، كانت الكلمة الأكثر إثارة في دائرة التكنولوجيا هي ChatGPT وتقنية النماذج واسعة النطاق التي تقف وراءها.
في السابق ، كان هناك Baidu Wenxin Yiyan ، و Alibaba Cloud Tongyi Qianwen ، و Huawei Pangu ، و HKUST Xunfei Xinghuo ، إلخ. مؤخرًا ، دخل Li Kaifu المكتب لإنشاء Zero One Wanwu ، وأطلق محرك Volcano "سفينة البركان". في غضون بضعة أشهر فقط ، أصبح اتجاهًا للعديد من المؤسسات لتطوير وإصدار تطبيقات نموذجية واسعة النطاق.
يوجد أكثر من 80 نموذجًا محليًا واسع النطاق بمقياس معلمة يبلغ 1 مليار أو أكثر ، ولا يزال العدد يتزايد بسرعة. إن جو التحضير لحرب تجارية حول النماذج الكبيرة قوي للغاية بالفعل.
سواء كانت شركة عملاقة كبيرة أو شركة عملاقة صغيرة ، فإنهم جميعًا بحاجة إلى مثل هذه الإجراءات لإظهار حساسيتهم للتكنولوجيا المتطورة وتراكمها على المدى الطويل. من خلال إطلاق التطبيق في وقت سابق ، يمكنك اختبار البيانات القيمة حول التفاعل بين النموذج الكبير والمستخدم قبل يوم واحد ، و "تراكم الكثير من الطعام ، والصورة هي الملك" في مسابقة المستقبل.
مفتاح النموذج الكبير هو عناصر مجال الذكاء الاصطناعي - الخوارزميات ، وقوة الحوسبة ، والبيانات ، والسيناريوهات / التطبيقات. تمثل الخوارزميات الاستراتيجيات ، وتحدد قوة الحوسبة الحد الأعلى وتضع عتبة ، والبيانات التي تساوي الحصص العسكرية ترمز أيضًا إلى التمييز بين الخير والشر. بالإضافة إلى العناصر الثلاثة ، يمثل المشهد / التطبيق اتجاه إرسال القوات.
حرب المائة نموذج على وشك أن تندلع ، فهل ستتطور شركة عملاقة بكل العناصر إلى ثورة لا نهائية للقدرات التكنولوجية؟ هل يمكن للعمالقة الصغار على المسار العمودي تعزيز موقعهم الريادي بمساعدة النماذج الكبيرة؟ من بين اللاعبين الجدد الذين حصلوا على تذاكر ، من يمكن أن يكون منافسًا جادًا للهيمنة على الصناعة؟
** لم يظهر النموذج العام واسع النطاق "مستجمعات المياه القوية" بعد **
ينقسم لاعبو النماذج الكبيرة بشكل أساسي إلى ثلاث فئات: الأول هو الإنترنت (Baidu و Ali و Tencent وما إلى ذلك) وعمالقة الصناعة (China Telecom و China Unicom ، إلخ.) الشركات الذكية (SenseTime و Yuncong و Guangyuewai ، إلخ.) ، والفئة الأخيرة هي معاهد البحث العلمي التي يمثلها مختبر شنغهاي للذكاء الاصطناعي ، وجامعة فودان ، ومعهد هاربين للتكنولوجيا ، وما إلى ذلك.
وفقًا للبيانات العامة ، اعتبارًا من بداية يوليو 2023 ، هناك أكثر من 80 نموذجًا واسع النطاق بمعايير تزيد عن مليار في بلدي ، ولا تزال تتزايد بسرعة. كلما زاد حجم النماذج التي تحتوي على هذا المقدار من المعلمات ، زاد حد المنافسة.
معظم النماذج واسعة النطاق التي تم إصدارها حتى الآن هي نماذج واسعة النطاق للأغراض العامة. هناك سببان رئيسيان: أحدهما هو أن المنافسة بين النماذج واسعة النطاق لا تزال غير واضحة ، والمستوى التقني البحت لم يتسع فجوة الأجيال ، والمشاركين في الصناعة لديهم الفرصة للسيطرة على العالم ؛ لم يظهر النموذج الواسع النطاق الموجه نحو التطبيق للجمهور بعد ، وهناك نقص في التوجيه الواضح للاتجاه. قبل "لحظة دردشة GPT" في يظهر نموذج محلي واسع النطاق ، إنه خيار نشط وسلبي للانضمام إلى النموذج واسع النطاق للأغراض العامة.
علاوة على ذلك ، من المحتمل جدًا أن يظهر عملاق جديد من مجال النماذج الكبيرة.
يعتقد Zhou Hongyi أن النماذج الكبيرة يجب أن تكون "عالمية" ، وأن الاستخدام العام فقط يمكنه دخول آلاف الأسر ، وتمكين مئات الصناعات ، وقيادة ثورة الذكاء الاصطناعي الجديدة.
ما تبقى غير مكتمل هو حجم الاستثمار والتعاون المطلوبين لتصبح قائد الثورة الجديدة. بغض النظر عما إذا كان النموذج الكبير هو المحيط الأزرق أو سوق المحيط الأحمر ، يجب أن يكون هناك بنية بيئية تتعاون فيها الأسماك الكبيرة والأسماك الصغيرة.
انطلاقًا من الوضع الحالي ، يمكن اعتبار نموذج كبير بمقياس 1 مليار معلمة حدًا للدخول ، ويمكن اعتبار نموذجًا كبيرًا بمقياس 10 مليار معلمة لديه القدرة على المنافسة في العالم ، ولكن حتى نموذج كبير بمقياس 100 مليار معلمة ليس الأفضل على الإطلاق .. المستوى الرائد للغبار.
إن مقدار المعلمات ليس قوة ساحقة تحدد الوضع في ساحة المعركة ، فالعوامل مثل قدرات جدولة الموارد وتراكم الخبرات طويلة المدى والاستثمار الكبير في البحث العلمي كلها اختلافات جوهرية طويلة الأمد في منافسة النماذج واسعة النطاق.
للمقارنة مع Open AI ، من الضروري أن نرى أن وراء انفجار Chat GPT هو دعم Microsoft الشامل للبيانات ، وقوة الحوسبة ، والأموال الضخمة ، بحيث جمعت الكثير من المال في المستقبل.
النماذج واسعة النطاق هي صناعات استثمارية طويلة الأجل ، والتي تعني ببساطة "حرق الأموال". لا يتحقق تراكم القدرة الحسابية والخوارزميات والبيانات بين عشية وضحاها ، فبعد إطلاق النموذج ، يحتاج إلى تدريب متكرر وتكرارات رشيقة ، ويتطور أخيرًا إلى "جسم ناضج".
في البيئة الحقيقية ، هل لاعب النموذج الكبير مدفوع بالتكنولوجيا أم الربح؟ Open AI هي أشهر شركة نموذجية واسعة النطاق في العالم.حتى مع المنتج المتفجر Chat GPT ، لا تزال قدرتها على التسويق مثيرة للقلق. كشركة تكنولوجية بقيمة سوقية تقترب من 30 مليار دولار أمريكي ، ستكون في قلب موجة الذكاء الاصطناعي في عام 2023. ولا تزال عائدات Open AI حتى الآن أقل من 200 مليون دولار أمريكي.
الاستثمار الأولي هو التكلفة الأولية فقط ، ويتطلب كل تدريب لاحق أموالًا حقيقية. كم عدد الشركات التي يمكن أن تقبل العائد المحزن على الاستثمار في منافسة النماذج واسعة النطاق؟ يثبت نجاح Chat GPT أن النموذج الكبير قد تم فتحه على مسار المنتج ، لكن هذا لا يعني نجاحًا كبيرًا على المستوى التجاري.
على الأقل من حيث نسبة المدخلات والمخرجات ، تتمتع شركات الإنترنت العملاقة بميزة نسبية أكبر ، ولديهم ما يكفي من الحافز والموارد لدعم الخسائر الاستراتيجية في المرحلة المبكرة ، تمامًا مثل Alibaba Cloud في ذلك الوقت.
بالنسبة إلى المدة التي سيستغرقها حرق الأموال ومتى ترى عائدًا مرضيًا على الاستثمار ، فإن الشركات الكبرى لا تعرف ، ولا شركات رأس المال الاستثماري للشركات الناشئة. هذه مقامرة يمكن أن تترك اللعبة في أي وقت ، والرقائق بمليارات الدولارات.
بالنسبة للاعبين النموذجيين واسعي النطاق الذين "يتمتع كل فرد بمزايا خاصة به" ، يجب عليهم أولاً استكشاف طبقة التطبيق وفتح الاختبار في أقرب وقت ممكن. وسيكون من يمكنه تجميع بيانات تفاعلية أكثر قيمة هو نقطة الانهيار في المنافسة التالية.
** الاحتياجات الرأسية والصعوبات الرأسية **
تدور المنافسة على النماذج العامة واسعة النطاق حول التنافس على الحق في صياغة البنية التحتية ، بينما يعتمد النموذج العمودي واسع النطاق على نماذج مفتوحة المصدر واسعة النطاق أو واجهات API في سيناريوهات محددة لتشكيل قدرة تنافسية متباينة في الصناعات المجزأة ، التركيز أكثر على تطبيق السيناريوهات.
في ساحة المعركة للنماذج واسعة النطاق للأغراض العامة ، مع مرور الوقت ، سيتخلف بعض اللاعبين الضعفاء تدريجياً ، وفي النهاية لن يكون هناك سوى عدد قليل من النماذج واسعة النطاق للأغراض العامة ، والتي ستلعب دور البنية التحتية . في الوقت نفسه ، لا تزال هذه النماذج الكبيرة تواجه مشكلة التجانس ، ولا تزال طبقة التطبيق تعتمد على النماذج العمودية الكبيرة.
يشبه النموذج الكبير للأغراض العامة مجموعة من النماذج الكبيرة الرأسية المتعددة. وكلما زاد عدد سيناريوهات التدريب ، زادت "عمومية" النموذج الكبير للأغراض العامة.
باعتبارها أول شركة في الصين تطرح منتجات شبيهة بـ Chat GPT ، فإن Baidu لديها حاجة ماسة لطبقات تطبيق عمودية للنماذج واسعة النطاق. قال Li Yanhong: "الأهم من عدد النماذج الكبيرة هو التطبيق ، وهو اختراق في تطبيق المجالات الرأسية. النقطة الرئيسية في استراتيجية المنافسة الدولية الجديدة ليست عدد النماذج الكبيرة الموجودة ، ولكن عدد النماذج الأصلية التطبيقات على النماذج الكبيرة. هذه التطبيقات إلى أي مدى تم تحسين كفاءة الإنتاج.
وفقًا لاستعارة Robin Li ، فإن النماذج الكبيرة ، وخاصة النماذج الكبيرة للأغراض العامة ، تشبه نظام التشغيل في عصر الذكاء الاصطناعي. سيتم تطوير جميع التطبيقات حول النموذج الكبير ، فوق طبقة التطبيق ، بما في ذلك التطبيقات.
في التحليل النهائي ، ما يسمى بـ "العالمي" ليس سوى مفهوم نسبي ، ولا يوجد نموذج للأغراض العامة قابل للتطبيق تمامًا على جميع المجالات وله عمق صناعي كافٍ. بأخذ Chat GPT كمثال ، لا تزال بعض الصناعات ذات معدل التسامح مع الخطأ المرتفع تستخدم على نطاق واسع بالفعل.حتى إذا كان الحل الذي قدمه النموذج الكبير خاطئًا ، فإن الخطأ يقتصر على نطاق محدود نسبيًا. ومع ذلك ، في سيناريوهات مثل الصناعة الثقيلة ، والفضاء ، والرعاية الطبية ، فإن الخسارة الناجمة عن خطأ لا يمكن قياسها ، أي أن Chat GPT لا يمكنها تلبية المتطلبات الرأسية والمهنية لسيناريوهات محددة.
لمراعاة متطلبات العمودية والاحتراف ، تعتبر البيانات عيبًا ، وهناك عدد أقل من الصناعات ذات عمق بيانات كافٍ وخندق مائي مستقر. من الصعب تقييم ما إذا كان من السهل الحصول على بيانات هذه الصناعات وما إذا كانت البيانات التي تم الحصول عليها يمكن أن تلبي المتطلبات المتغيرة باستمرار لصناعات معينة.
عمالقة الإنترنت لديهم كمية كبيرة من بيانات الشبكة مثل التجارة الإلكترونية والشبكات الاجتماعية والبحث ، لكن أنواع البيانات ليست شاملة بما فيه الكفاية ، وجودة البيانات غير مضمونة.لا تزال المجموعة التي يمكن تدريبها باللغة الصينية بحاجة الكثير من أعمال التعدين.
في الآونة الأخيرة ، في مجالات الشؤون الحكومية والأمن العام والرعاية الطبية ، يتم تنفيذ نماذج عمودية واسعة النطاق واحدة تلو الأخرى. على سبيل المثال ، طور Yunzhisheng نموذجًا واسع النطاق "الجبل والبحر" ذاتيًا في مجال الرعاية الطبية الذكية ، جنبًا إلى جنب مع تقنيات التفاعل الصوتي الذكي المتكاملة مثل معالجة الإشارات الصوتية الأمامية ، والتعرف على بصمة الصوت ، والتعرف على الكلام ، و تركيب الكلام ، من المتوقع أن يؤدي إلى تحسين كفاءة إدخال السجلات الطبية الإلكترونية للأطباء بأكثر من 400٪ ، وتوفير أكثر من 40٪ من وقت الاستشارة لمريض واحد ، وتحسين كفاءة العيادات الخارجية للطبيب بأكثر من 66٪.
استنادًا إلى وثائقها الرسمية ووثائق السياسة وأدلة الشؤون الحكومية وغيرها من البيانات كبيانات تدريب احترافي ، أنشأت TRS نموذجًا كبيرًا للشؤون الحكومية.
في المجال المالي ، ستبدأ Hang Seng Electronics في تخطيط وتصميم منتجات نموذجية مالية واسعة النطاق في نهاية مارس 2023. في نهاية شهر يونيو ، أصدرت شركة Hang Seng Electronics وشركتها الفرعية Hang Seng Juyuan منتجًا ماليًا جديدًا للذكاء الرقمي يعتمد على تقنية نموذج اللغة الكبيرة - مساعد الفوتون المالي الذكي ومنصة أبحاث الاستثمار الذكية الجديدة WarrenQ.
تراهن شركة Tencent ، شركة الإنترنت العملاقة ذات الموارد الصناعية المتعددة ، على جوانب متعددة. في أواخر يونيو ، أعلنت Tencent عن حلول خدمة MaaS التي تغطي 10 صناعات بما في ذلك التمويل والسياحة الثقافية والشؤون الحكومية والتعليم ، بإجمالي أكثر من 50 حلًا.
في الوقت نفسه ، غالبًا ما لا تقتصر البيانات المطلوبة بواسطة النموذج العمودي الكبير على الصناعة. قد تتطلب بعض الأعمال التجارية تكامل البيانات من صناعات أخرى أو أكثر. يعتمد تدريب النموذج والتطبيق على التعاون عبر الصناعة للمؤسسات أو الموارد من عمالقة الإنترنت.
** قوة الحوسبة: الطوب القوي يطير؟ **
في اندفاع الذهب في غرب الولايات المتحدة في القرن التاسع عشر ، كان حدثًا احتماليًا أن المنقبين عن الذهب يمكنهم بالفعل جني الأموال ، في حين كانت نتيجة حتمية أن بائعي المجارف جني الأموال.
في اندفاع الذكاء الاصطناعي للذهب ، لا يزال وضع ساحة المعركة للنموذج الكبير غير واضح ، ولا يزال اللاعبون يتقدمون ، لكن "بائع المجرفة" قد فاز بالفعل. بالاعتماد على اتجاه رقائق الذكاء الاصطناعي والنماذج الكبيرة ، وسعت Nvidia الفجوة مع منافستها AMD ، ودخلت قيمتها السوقية "نادي تريليون دولار".
اقترح الرئيس التنفيذي لمنظمة Open AI ، Sam Altman ، إصدارًا جديدًا من قانون Moore ، أي أن قوة الحوسبة للذكاء الاصطناعي العالمي ستتضاعف كل 18 شهرًا. يتطلب الحفاظ على هذه الحسابات دعم شرائح تدريب الذكاء الاصطناعي ، وتتجاوز حصة Nvidia في السوق في هذا المجال 90٪.
تم قطع منتجات شرائح الذكاء الاصطناعي من Nvidia بشكل محموم من قبل شركات التكنولوجيا الكبرى في جميع أنحاء العالم: في مارس 2023 ، أعلنت Microsoft أنها ساعدت OpenAI في بناء مركز حوسبة جديد يضم عشرات الآلاف من A100s ؛ في مايو ، أطلقت Google H100 مع 26000 قطعة مجموعة الحوسبة ComputeEngineA3. بالإضافة إلى ذلك ، وفقًا للمعلومات الواردة من China National Finance Securities ، طلبت ByteDance أكثر من 1 مليار دولار أمريكي في وحدات معالجة الرسوميات هذا العام ، ويُقدر أن هناك 100،000 قطعة من A100 و H800 وصلت ولم تصل بعد. يتم أيضًا استخدام عشرات الآلاف من شرائح H800 في الإصدار الجديد من مركز خدمة الحوسبة عالية الأداء Tencent Cloud الذي أصدرته Tencent.
قال المدير المالي لشركة Nvidia ، كريس ، إن الطلب الحالي في السوق على قوة حوسبة الذكاء الاصطناعي قد تجاوز توقعات الشركة للأرباع القليلة القادمة ، وهناك الكثير من الطلبات التي يجب الوفاء بها.
بالطبع ، من غير المجدي بالنسبة لنا أن نحسد الأموال التي تجنيها Nvidia.
مسار GPU المحلي يلحق بالركب أيضًا. لا توجد فقط شرائح AI التي تم تطويرها ذاتيًا لعمالقة الإنترنت ، مثل Baidu AI chip Kunlun ، وشريحة معالجة الفيديو Tencent "Canghai" وشريحة AI "Zixiao" ، وما إلى ذلك ، ولكن أيضًا Suiyuan Technology ، Tianshu Zhixin ، شركات ناشئة مثل Moore Thread التي تطور وحدات معالجة الرسومات للأغراض العامة. تُستخدم وحدات معالجة الرسومات للأغراض العامة في العديد من المهام ذات الأغراض العامة ، بما في ذلك قدرات الحوسبة المتوازية للغاية ومراكز الحوسبة واسعة النطاق. كما حدث تقدم كبير في السنوات الأخيرة ، والفجوة مع وحدات معالجة الرسومات عالية الأداء تضيق تدريجياً.
اقترح وو هيكان ، الأكاديمي في الأكاديمية الصينية للهندسة ، أنه في ظل تنسيق العلوم والتكنولوجيا الوطنية والخطط الصناعية ، يجب تشكيل تقسيم معقول للعمل لتشكيل قوة حوسبة مشتركة ، ومنصة قوة الحوسبة الوطنية. يجب فتح المختبر لدعم مختلف نماذج التدريب على نطاق واسع. وفي الوقت نفسه ، يُقترح تشكيل تحالف قوة حوسبة لتركيز وحدات معالجة الرسومات المتطورة الحالية. توفر موارد الحوسبة قوة الحوسبة المطلوبة للتدريب على بيانات النماذج الكبيرة.
بالإضافة إلى وحدات معالجة الرسومات عالية الأداء ، تعتبر منصات الحوسبة منخفضة التكلفة أيضًا فرصًا جديدة في السوق. كشفت Jiuzhang Yunji مؤخرًا أنها ستستمر في التعاون مع الشركات المصنعة للسحابة المملوكة للدولة ، وستتضمن عددًا كبيرًا من مراكز الحوسبة الذكية في السوق كشركاء ، وتزويد العملاء بمنصة بحث وتطوير نموذجية للذكاء الاصطناعي تدمج البرامج والأجهزة. سيتم ربط تكلفة العملاء بقوة الحوسبة.
القوة الحاسوبية هي أساس تطوير النماذج الكبيرة ، وهي شرط ضروري ولكنها ليست شرطًا كافيًا ، ولا يزال الحد الأقصى للدور الذي يمكن أن تلعبه القدرة الحاسوبية يعتمد على اتجاه الاستخدام. فقط عندما يسير ابتكار الخوارزمية ، وبناء موارد البيانات ، وتكرار إطار التدريب جنبًا إلى جنب ، يمكن أن يكون من الممكن إنشاء "قوالب قوية تطير".
** السياسة: التوجيه والتنظيم في اللحظات الحرجة **
تتزامن فترة انفجار الذكاء الاصطناعي مع اللحظة الحاسمة لحوكمة الخوارزمية وتسجيل الخوارزمية في بلدنا.
في وقت مبكر من عام 2021 ، وضعت "الآراء التوجيهية بشأن تعزيز الحوكمة الشاملة لخوارزميات خدمة معلومات الإنترنت" إدارة ملفات الخوارزميات كجزء مهم من تحسين نظام الإشراف. وتنص لوائح الإدارة بوضوح أو تذكر أن "مقدمي خدمة توصية الخوارزميات مع يجب على سمات الرأي العام أو قدرات التعبئة الاجتماعية تنفيذ إجراءات التسجيل ".
في أبريل 2023 ، صاغت إدارة الفضاء الإلكتروني في الصين "الإجراءات الإدارية لخدمات الذكاء الاصطناعي التوليدية (مسودة للتعليق)" للتشاور العام. في يونيو ، أظهرت "خطة العمل التشريعية لعام 2023 لمجلس الدولة" الصادرة عن مجلس الدولة أن مشروع قانون الذكاء الاصطناعي قد تم إعداده لتقديمه إلى اللجنة الدائمة للمجلس الوطني لنواب الشعب الصيني لمناقشته.
ذكرت "تدابير إدارة خدمة الذكاء الاصطناعي التوليدية (مسودة للتعليق)" أنه قبل استخدام منتجات الذكاء الاصطناعي التوليدية لتقديم الخدمات للجمهور ، يجب إبلاغ شبكة الدولة وفقًا لـ "اللوائح الخاصة بالتقييم الأمني لمعلومات الإنترنت الخدمات ذات سمات الرأي العام أو قدرات التعبئة الاجتماعية ". يتقدم قسم المعلومات لإجراء تقييم أمني ، وتنفيذ إجراءات حفظ الخوارزمية والتعديل والإلغاء وفقًا لـ" لوائح إدارة توصيات خوارزمية خدمة معلومات الإنترنت ".
هذا أيضًا أحد أسباب عدم وجود منتجات نماذج واسعة النطاق متاحة للجمهور.
يعتقد البروفيسور تشين بينغ ، نائب عميد كلية الحقوق بجامعة نانكاي والباحث الخاص في معهد أبحاث استراتيجية تطوير الذكاء الاصطناعي للجيل الجديد في الصين ، أن التنظيم المسبق لن يضر بالضرورة الابتكار التكنولوجي ، ولكن تجدر الإشارة إلى أنه بسبب المراجعة ، سيزيد عدد المؤسسات إلى حد معين. إذا لم يتم تحديد نطاق المراجعة المسبقة بشكل صحيح ، فقد يعيق البحث والتطوير وكفاءة التدريب لمنتجات الذكاء الاصطناعي التوليدية ، ويؤدي بشكل موضوعي إلى تباطؤ في تطوير الذكاء الاصطناعي التوليدي.
نظرًا لأن مخاطر الذكاء الاصطناعي لا يمكن تقديرها تمامًا مسبقًا ، وقد يتسبب الإشراف بعد الحدث في أضرار جسيمة ، تتبنى بلدي حاليًا عملية الإشراف الكامل على تطوير الذكاء الاصطناعي.
بموجب تنظيم العملية برمتها ، ستزداد بلا شك تكلفة الامتثال للاعبين النموذجيين على نطاق واسع ، كما يحث نظام حفظ السجلات اللاعبين في اللعبة على السعي إلى حفظ السجلات أولاً من أجل الترويج للمنتجات في السوق مبكرًا ، بموضوعية تسريع سرعة الموجات الكبيرة. يرافق التحسين التدريجي للقوانين واللوائح عملية تعديل وزاري في الصناعة وترك الضعيف وراءه ، وهو ما يمكن أيضًا أن يجلب لحظة إزالة الغيوم إلى الشمس مبكرًا.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
متى يولد العملاق الجديد؟ نموذج كبير ينتظر "مستجمعات المياه"
** المصدر | ** Zero One Finance
** المؤلف | ** ** شين تشويان **
منذ عام 2023 ، كانت الكلمة الأكثر إثارة في دائرة التكنولوجيا هي ChatGPT وتقنية النماذج واسعة النطاق التي تقف وراءها.
في السابق ، كان هناك Baidu Wenxin Yiyan ، و Alibaba Cloud Tongyi Qianwen ، و Huawei Pangu ، و HKUST Xunfei Xinghuo ، إلخ. مؤخرًا ، دخل Li Kaifu المكتب لإنشاء Zero One Wanwu ، وأطلق محرك Volcano "سفينة البركان". في غضون بضعة أشهر فقط ، أصبح اتجاهًا للعديد من المؤسسات لتطوير وإصدار تطبيقات نموذجية واسعة النطاق.
يوجد أكثر من 80 نموذجًا محليًا واسع النطاق بمقياس معلمة يبلغ 1 مليار أو أكثر ، ولا يزال العدد يتزايد بسرعة. إن جو التحضير لحرب تجارية حول النماذج الكبيرة قوي للغاية بالفعل.
سواء كانت شركة عملاقة كبيرة أو شركة عملاقة صغيرة ، فإنهم جميعًا بحاجة إلى مثل هذه الإجراءات لإظهار حساسيتهم للتكنولوجيا المتطورة وتراكمها على المدى الطويل. من خلال إطلاق التطبيق في وقت سابق ، يمكنك اختبار البيانات القيمة حول التفاعل بين النموذج الكبير والمستخدم قبل يوم واحد ، و "تراكم الكثير من الطعام ، والصورة هي الملك" في مسابقة المستقبل.
مفتاح النموذج الكبير هو عناصر مجال الذكاء الاصطناعي - الخوارزميات ، وقوة الحوسبة ، والبيانات ، والسيناريوهات / التطبيقات. تمثل الخوارزميات الاستراتيجيات ، وتحدد قوة الحوسبة الحد الأعلى وتضع عتبة ، والبيانات التي تساوي الحصص العسكرية ترمز أيضًا إلى التمييز بين الخير والشر. بالإضافة إلى العناصر الثلاثة ، يمثل المشهد / التطبيق اتجاه إرسال القوات.
حرب المائة نموذج على وشك أن تندلع ، فهل ستتطور شركة عملاقة بكل العناصر إلى ثورة لا نهائية للقدرات التكنولوجية؟ هل يمكن للعمالقة الصغار على المسار العمودي تعزيز موقعهم الريادي بمساعدة النماذج الكبيرة؟ من بين اللاعبين الجدد الذين حصلوا على تذاكر ، من يمكن أن يكون منافسًا جادًا للهيمنة على الصناعة؟
** لم يظهر النموذج العام واسع النطاق "مستجمعات المياه القوية" بعد **
ينقسم لاعبو النماذج الكبيرة بشكل أساسي إلى ثلاث فئات: الأول هو الإنترنت (Baidu و Ali و Tencent وما إلى ذلك) وعمالقة الصناعة (China Telecom و China Unicom ، إلخ.) الشركات الذكية (SenseTime و Yuncong و Guangyuewai ، إلخ.) ، والفئة الأخيرة هي معاهد البحث العلمي التي يمثلها مختبر شنغهاي للذكاء الاصطناعي ، وجامعة فودان ، ومعهد هاربين للتكنولوجيا ، وما إلى ذلك.
وفقًا للبيانات العامة ، اعتبارًا من بداية يوليو 2023 ، هناك أكثر من 80 نموذجًا واسع النطاق بمعايير تزيد عن مليار في بلدي ، ولا تزال تتزايد بسرعة. كلما زاد حجم النماذج التي تحتوي على هذا المقدار من المعلمات ، زاد حد المنافسة.
معظم النماذج واسعة النطاق التي تم إصدارها حتى الآن هي نماذج واسعة النطاق للأغراض العامة. هناك سببان رئيسيان: أحدهما هو أن المنافسة بين النماذج واسعة النطاق لا تزال غير واضحة ، والمستوى التقني البحت لم يتسع فجوة الأجيال ، والمشاركين في الصناعة لديهم الفرصة للسيطرة على العالم ؛ لم يظهر النموذج الواسع النطاق الموجه نحو التطبيق للجمهور بعد ، وهناك نقص في التوجيه الواضح للاتجاه. قبل "لحظة دردشة GPT" في يظهر نموذج محلي واسع النطاق ، إنه خيار نشط وسلبي للانضمام إلى النموذج واسع النطاق للأغراض العامة.
علاوة على ذلك ، من المحتمل جدًا أن يظهر عملاق جديد من مجال النماذج الكبيرة.
يعتقد Zhou Hongyi أن النماذج الكبيرة يجب أن تكون "عالمية" ، وأن الاستخدام العام فقط يمكنه دخول آلاف الأسر ، وتمكين مئات الصناعات ، وقيادة ثورة الذكاء الاصطناعي الجديدة.
ما تبقى غير مكتمل هو حجم الاستثمار والتعاون المطلوبين لتصبح قائد الثورة الجديدة. بغض النظر عما إذا كان النموذج الكبير هو المحيط الأزرق أو سوق المحيط الأحمر ، يجب أن يكون هناك بنية بيئية تتعاون فيها الأسماك الكبيرة والأسماك الصغيرة.
انطلاقًا من الوضع الحالي ، يمكن اعتبار نموذج كبير بمقياس 1 مليار معلمة حدًا للدخول ، ويمكن اعتبار نموذجًا كبيرًا بمقياس 10 مليار معلمة لديه القدرة على المنافسة في العالم ، ولكن حتى نموذج كبير بمقياس 100 مليار معلمة ليس الأفضل على الإطلاق .. المستوى الرائد للغبار.
إن مقدار المعلمات ليس قوة ساحقة تحدد الوضع في ساحة المعركة ، فالعوامل مثل قدرات جدولة الموارد وتراكم الخبرات طويلة المدى والاستثمار الكبير في البحث العلمي كلها اختلافات جوهرية طويلة الأمد في منافسة النماذج واسعة النطاق.
للمقارنة مع Open AI ، من الضروري أن نرى أن وراء انفجار Chat GPT هو دعم Microsoft الشامل للبيانات ، وقوة الحوسبة ، والأموال الضخمة ، بحيث جمعت الكثير من المال في المستقبل.
النماذج واسعة النطاق هي صناعات استثمارية طويلة الأجل ، والتي تعني ببساطة "حرق الأموال". لا يتحقق تراكم القدرة الحسابية والخوارزميات والبيانات بين عشية وضحاها ، فبعد إطلاق النموذج ، يحتاج إلى تدريب متكرر وتكرارات رشيقة ، ويتطور أخيرًا إلى "جسم ناضج".
في البيئة الحقيقية ، هل لاعب النموذج الكبير مدفوع بالتكنولوجيا أم الربح؟ Open AI هي أشهر شركة نموذجية واسعة النطاق في العالم.حتى مع المنتج المتفجر Chat GPT ، لا تزال قدرتها على التسويق مثيرة للقلق. كشركة تكنولوجية بقيمة سوقية تقترب من 30 مليار دولار أمريكي ، ستكون في قلب موجة الذكاء الاصطناعي في عام 2023. ولا تزال عائدات Open AI حتى الآن أقل من 200 مليون دولار أمريكي.
الاستثمار الأولي هو التكلفة الأولية فقط ، ويتطلب كل تدريب لاحق أموالًا حقيقية. كم عدد الشركات التي يمكن أن تقبل العائد المحزن على الاستثمار في منافسة النماذج واسعة النطاق؟ يثبت نجاح Chat GPT أن النموذج الكبير قد تم فتحه على مسار المنتج ، لكن هذا لا يعني نجاحًا كبيرًا على المستوى التجاري.
على الأقل من حيث نسبة المدخلات والمخرجات ، تتمتع شركات الإنترنت العملاقة بميزة نسبية أكبر ، ولديهم ما يكفي من الحافز والموارد لدعم الخسائر الاستراتيجية في المرحلة المبكرة ، تمامًا مثل Alibaba Cloud في ذلك الوقت.
بالنسبة إلى المدة التي سيستغرقها حرق الأموال ومتى ترى عائدًا مرضيًا على الاستثمار ، فإن الشركات الكبرى لا تعرف ، ولا شركات رأس المال الاستثماري للشركات الناشئة. هذه مقامرة يمكن أن تترك اللعبة في أي وقت ، والرقائق بمليارات الدولارات.
بالنسبة للاعبين النموذجيين واسعي النطاق الذين "يتمتع كل فرد بمزايا خاصة به" ، يجب عليهم أولاً استكشاف طبقة التطبيق وفتح الاختبار في أقرب وقت ممكن. وسيكون من يمكنه تجميع بيانات تفاعلية أكثر قيمة هو نقطة الانهيار في المنافسة التالية.
** الاحتياجات الرأسية والصعوبات الرأسية **
تدور المنافسة على النماذج العامة واسعة النطاق حول التنافس على الحق في صياغة البنية التحتية ، بينما يعتمد النموذج العمودي واسع النطاق على نماذج مفتوحة المصدر واسعة النطاق أو واجهات API في سيناريوهات محددة لتشكيل قدرة تنافسية متباينة في الصناعات المجزأة ، التركيز أكثر على تطبيق السيناريوهات.
في ساحة المعركة للنماذج واسعة النطاق للأغراض العامة ، مع مرور الوقت ، سيتخلف بعض اللاعبين الضعفاء تدريجياً ، وفي النهاية لن يكون هناك سوى عدد قليل من النماذج واسعة النطاق للأغراض العامة ، والتي ستلعب دور البنية التحتية . في الوقت نفسه ، لا تزال هذه النماذج الكبيرة تواجه مشكلة التجانس ، ولا تزال طبقة التطبيق تعتمد على النماذج العمودية الكبيرة.
يشبه النموذج الكبير للأغراض العامة مجموعة من النماذج الكبيرة الرأسية المتعددة. وكلما زاد عدد سيناريوهات التدريب ، زادت "عمومية" النموذج الكبير للأغراض العامة.
باعتبارها أول شركة في الصين تطرح منتجات شبيهة بـ Chat GPT ، فإن Baidu لديها حاجة ماسة لطبقات تطبيق عمودية للنماذج واسعة النطاق. قال Li Yanhong: "الأهم من عدد النماذج الكبيرة هو التطبيق ، وهو اختراق في تطبيق المجالات الرأسية. النقطة الرئيسية في استراتيجية المنافسة الدولية الجديدة ليست عدد النماذج الكبيرة الموجودة ، ولكن عدد النماذج الأصلية التطبيقات على النماذج الكبيرة. هذه التطبيقات إلى أي مدى تم تحسين كفاءة الإنتاج.
وفقًا لاستعارة Robin Li ، فإن النماذج الكبيرة ، وخاصة النماذج الكبيرة للأغراض العامة ، تشبه نظام التشغيل في عصر الذكاء الاصطناعي. سيتم تطوير جميع التطبيقات حول النموذج الكبير ، فوق طبقة التطبيق ، بما في ذلك التطبيقات.
في التحليل النهائي ، ما يسمى بـ "العالمي" ليس سوى مفهوم نسبي ، ولا يوجد نموذج للأغراض العامة قابل للتطبيق تمامًا على جميع المجالات وله عمق صناعي كافٍ. بأخذ Chat GPT كمثال ، لا تزال بعض الصناعات ذات معدل التسامح مع الخطأ المرتفع تستخدم على نطاق واسع بالفعل.حتى إذا كان الحل الذي قدمه النموذج الكبير خاطئًا ، فإن الخطأ يقتصر على نطاق محدود نسبيًا. ومع ذلك ، في سيناريوهات مثل الصناعة الثقيلة ، والفضاء ، والرعاية الطبية ، فإن الخسارة الناجمة عن خطأ لا يمكن قياسها ، أي أن Chat GPT لا يمكنها تلبية المتطلبات الرأسية والمهنية لسيناريوهات محددة.
لمراعاة متطلبات العمودية والاحتراف ، تعتبر البيانات عيبًا ، وهناك عدد أقل من الصناعات ذات عمق بيانات كافٍ وخندق مائي مستقر. من الصعب تقييم ما إذا كان من السهل الحصول على بيانات هذه الصناعات وما إذا كانت البيانات التي تم الحصول عليها يمكن أن تلبي المتطلبات المتغيرة باستمرار لصناعات معينة.
عمالقة الإنترنت لديهم كمية كبيرة من بيانات الشبكة مثل التجارة الإلكترونية والشبكات الاجتماعية والبحث ، لكن أنواع البيانات ليست شاملة بما فيه الكفاية ، وجودة البيانات غير مضمونة.لا تزال المجموعة التي يمكن تدريبها باللغة الصينية بحاجة الكثير من أعمال التعدين.
في الآونة الأخيرة ، في مجالات الشؤون الحكومية والأمن العام والرعاية الطبية ، يتم تنفيذ نماذج عمودية واسعة النطاق واحدة تلو الأخرى. على سبيل المثال ، طور Yunzhisheng نموذجًا واسع النطاق "الجبل والبحر" ذاتيًا في مجال الرعاية الطبية الذكية ، جنبًا إلى جنب مع تقنيات التفاعل الصوتي الذكي المتكاملة مثل معالجة الإشارات الصوتية الأمامية ، والتعرف على بصمة الصوت ، والتعرف على الكلام ، و تركيب الكلام ، من المتوقع أن يؤدي إلى تحسين كفاءة إدخال السجلات الطبية الإلكترونية للأطباء بأكثر من 400٪ ، وتوفير أكثر من 40٪ من وقت الاستشارة لمريض واحد ، وتحسين كفاءة العيادات الخارجية للطبيب بأكثر من 66٪.
استنادًا إلى وثائقها الرسمية ووثائق السياسة وأدلة الشؤون الحكومية وغيرها من البيانات كبيانات تدريب احترافي ، أنشأت TRS نموذجًا كبيرًا للشؤون الحكومية.
في المجال المالي ، ستبدأ Hang Seng Electronics في تخطيط وتصميم منتجات نموذجية مالية واسعة النطاق في نهاية مارس 2023. في نهاية شهر يونيو ، أصدرت شركة Hang Seng Electronics وشركتها الفرعية Hang Seng Juyuan منتجًا ماليًا جديدًا للذكاء الرقمي يعتمد على تقنية نموذج اللغة الكبيرة - مساعد الفوتون المالي الذكي ومنصة أبحاث الاستثمار الذكية الجديدة WarrenQ.
تراهن شركة Tencent ، شركة الإنترنت العملاقة ذات الموارد الصناعية المتعددة ، على جوانب متعددة. في أواخر يونيو ، أعلنت Tencent عن حلول خدمة MaaS التي تغطي 10 صناعات بما في ذلك التمويل والسياحة الثقافية والشؤون الحكومية والتعليم ، بإجمالي أكثر من 50 حلًا.
في الوقت نفسه ، غالبًا ما لا تقتصر البيانات المطلوبة بواسطة النموذج العمودي الكبير على الصناعة. قد تتطلب بعض الأعمال التجارية تكامل البيانات من صناعات أخرى أو أكثر. يعتمد تدريب النموذج والتطبيق على التعاون عبر الصناعة للمؤسسات أو الموارد من عمالقة الإنترنت.
** قوة الحوسبة: الطوب القوي يطير؟ **
في اندفاع الذهب في غرب الولايات المتحدة في القرن التاسع عشر ، كان حدثًا احتماليًا أن المنقبين عن الذهب يمكنهم بالفعل جني الأموال ، في حين كانت نتيجة حتمية أن بائعي المجارف جني الأموال.
في اندفاع الذكاء الاصطناعي للذهب ، لا يزال وضع ساحة المعركة للنموذج الكبير غير واضح ، ولا يزال اللاعبون يتقدمون ، لكن "بائع المجرفة" قد فاز بالفعل. بالاعتماد على اتجاه رقائق الذكاء الاصطناعي والنماذج الكبيرة ، وسعت Nvidia الفجوة مع منافستها AMD ، ودخلت قيمتها السوقية "نادي تريليون دولار".
اقترح الرئيس التنفيذي لمنظمة Open AI ، Sam Altman ، إصدارًا جديدًا من قانون Moore ، أي أن قوة الحوسبة للذكاء الاصطناعي العالمي ستتضاعف كل 18 شهرًا. يتطلب الحفاظ على هذه الحسابات دعم شرائح تدريب الذكاء الاصطناعي ، وتتجاوز حصة Nvidia في السوق في هذا المجال 90٪.
تم قطع منتجات شرائح الذكاء الاصطناعي من Nvidia بشكل محموم من قبل شركات التكنولوجيا الكبرى في جميع أنحاء العالم: في مارس 2023 ، أعلنت Microsoft أنها ساعدت OpenAI في بناء مركز حوسبة جديد يضم عشرات الآلاف من A100s ؛ في مايو ، أطلقت Google H100 مع 26000 قطعة مجموعة الحوسبة ComputeEngineA3. بالإضافة إلى ذلك ، وفقًا للمعلومات الواردة من China National Finance Securities ، طلبت ByteDance أكثر من 1 مليار دولار أمريكي في وحدات معالجة الرسوميات هذا العام ، ويُقدر أن هناك 100،000 قطعة من A100 و H800 وصلت ولم تصل بعد. يتم أيضًا استخدام عشرات الآلاف من شرائح H800 في الإصدار الجديد من مركز خدمة الحوسبة عالية الأداء Tencent Cloud الذي أصدرته Tencent.
قال المدير المالي لشركة Nvidia ، كريس ، إن الطلب الحالي في السوق على قوة حوسبة الذكاء الاصطناعي قد تجاوز توقعات الشركة للأرباع القليلة القادمة ، وهناك الكثير من الطلبات التي يجب الوفاء بها.
بالطبع ، من غير المجدي بالنسبة لنا أن نحسد الأموال التي تجنيها Nvidia.
مسار GPU المحلي يلحق بالركب أيضًا. لا توجد فقط شرائح AI التي تم تطويرها ذاتيًا لعمالقة الإنترنت ، مثل Baidu AI chip Kunlun ، وشريحة معالجة الفيديو Tencent "Canghai" وشريحة AI "Zixiao" ، وما إلى ذلك ، ولكن أيضًا Suiyuan Technology ، Tianshu Zhixin ، شركات ناشئة مثل Moore Thread التي تطور وحدات معالجة الرسومات للأغراض العامة. تُستخدم وحدات معالجة الرسومات للأغراض العامة في العديد من المهام ذات الأغراض العامة ، بما في ذلك قدرات الحوسبة المتوازية للغاية ومراكز الحوسبة واسعة النطاق. كما حدث تقدم كبير في السنوات الأخيرة ، والفجوة مع وحدات معالجة الرسومات عالية الأداء تضيق تدريجياً.
اقترح وو هيكان ، الأكاديمي في الأكاديمية الصينية للهندسة ، أنه في ظل تنسيق العلوم والتكنولوجيا الوطنية والخطط الصناعية ، يجب تشكيل تقسيم معقول للعمل لتشكيل قوة حوسبة مشتركة ، ومنصة قوة الحوسبة الوطنية. يجب فتح المختبر لدعم مختلف نماذج التدريب على نطاق واسع. وفي الوقت نفسه ، يُقترح تشكيل تحالف قوة حوسبة لتركيز وحدات معالجة الرسومات المتطورة الحالية. توفر موارد الحوسبة قوة الحوسبة المطلوبة للتدريب على بيانات النماذج الكبيرة.
بالإضافة إلى وحدات معالجة الرسومات عالية الأداء ، تعتبر منصات الحوسبة منخفضة التكلفة أيضًا فرصًا جديدة في السوق. كشفت Jiuzhang Yunji مؤخرًا أنها ستستمر في التعاون مع الشركات المصنعة للسحابة المملوكة للدولة ، وستتضمن عددًا كبيرًا من مراكز الحوسبة الذكية في السوق كشركاء ، وتزويد العملاء بمنصة بحث وتطوير نموذجية للذكاء الاصطناعي تدمج البرامج والأجهزة. سيتم ربط تكلفة العملاء بقوة الحوسبة.
القوة الحاسوبية هي أساس تطوير النماذج الكبيرة ، وهي شرط ضروري ولكنها ليست شرطًا كافيًا ، ولا يزال الحد الأقصى للدور الذي يمكن أن تلعبه القدرة الحاسوبية يعتمد على اتجاه الاستخدام. فقط عندما يسير ابتكار الخوارزمية ، وبناء موارد البيانات ، وتكرار إطار التدريب جنبًا إلى جنب ، يمكن أن يكون من الممكن إنشاء "قوالب قوية تطير".
** السياسة: التوجيه والتنظيم في اللحظات الحرجة **
تتزامن فترة انفجار الذكاء الاصطناعي مع اللحظة الحاسمة لحوكمة الخوارزمية وتسجيل الخوارزمية في بلدنا.
في وقت مبكر من عام 2021 ، وضعت "الآراء التوجيهية بشأن تعزيز الحوكمة الشاملة لخوارزميات خدمة معلومات الإنترنت" إدارة ملفات الخوارزميات كجزء مهم من تحسين نظام الإشراف. وتنص لوائح الإدارة بوضوح أو تذكر أن "مقدمي خدمة توصية الخوارزميات مع يجب على سمات الرأي العام أو قدرات التعبئة الاجتماعية تنفيذ إجراءات التسجيل ".
في أبريل 2023 ، صاغت إدارة الفضاء الإلكتروني في الصين "الإجراءات الإدارية لخدمات الذكاء الاصطناعي التوليدية (مسودة للتعليق)" للتشاور العام. في يونيو ، أظهرت "خطة العمل التشريعية لعام 2023 لمجلس الدولة" الصادرة عن مجلس الدولة أن مشروع قانون الذكاء الاصطناعي قد تم إعداده لتقديمه إلى اللجنة الدائمة للمجلس الوطني لنواب الشعب الصيني لمناقشته.
ذكرت "تدابير إدارة خدمة الذكاء الاصطناعي التوليدية (مسودة للتعليق)" أنه قبل استخدام منتجات الذكاء الاصطناعي التوليدية لتقديم الخدمات للجمهور ، يجب إبلاغ شبكة الدولة وفقًا لـ "اللوائح الخاصة بالتقييم الأمني لمعلومات الإنترنت الخدمات ذات سمات الرأي العام أو قدرات التعبئة الاجتماعية ". يتقدم قسم المعلومات لإجراء تقييم أمني ، وتنفيذ إجراءات حفظ الخوارزمية والتعديل والإلغاء وفقًا لـ" لوائح إدارة توصيات خوارزمية خدمة معلومات الإنترنت ".
هذا أيضًا أحد أسباب عدم وجود منتجات نماذج واسعة النطاق متاحة للجمهور.
يعتقد البروفيسور تشين بينغ ، نائب عميد كلية الحقوق بجامعة نانكاي والباحث الخاص في معهد أبحاث استراتيجية تطوير الذكاء الاصطناعي للجيل الجديد في الصين ، أن التنظيم المسبق لن يضر بالضرورة الابتكار التكنولوجي ، ولكن تجدر الإشارة إلى أنه بسبب المراجعة ، سيزيد عدد المؤسسات إلى حد معين. إذا لم يتم تحديد نطاق المراجعة المسبقة بشكل صحيح ، فقد يعيق البحث والتطوير وكفاءة التدريب لمنتجات الذكاء الاصطناعي التوليدية ، ويؤدي بشكل موضوعي إلى تباطؤ في تطوير الذكاء الاصطناعي التوليدي.
نظرًا لأن مخاطر الذكاء الاصطناعي لا يمكن تقديرها تمامًا مسبقًا ، وقد يتسبب الإشراف بعد الحدث في أضرار جسيمة ، تتبنى بلدي حاليًا عملية الإشراف الكامل على تطوير الذكاء الاصطناعي.
بموجب تنظيم العملية برمتها ، ستزداد بلا شك تكلفة الامتثال للاعبين النموذجيين على نطاق واسع ، كما يحث نظام حفظ السجلات اللاعبين في اللعبة على السعي إلى حفظ السجلات أولاً من أجل الترويج للمنتجات في السوق مبكرًا ، بموضوعية تسريع سرعة الموجات الكبيرة. يرافق التحسين التدريجي للقوانين واللوائح عملية تعديل وزاري في الصناعة وترك الضعيف وراءه ، وهو ما يمكن أيضًا أن يجلب لحظة إزالة الغيوم إلى الشمس مبكرًا.