📢 Gate廣場專屬 #WXTM创作大赛# 正式開啓!
聚焦 CandyDrop 第59期 —— MinoTari (WXTM),總獎池 70,000 枚 WXTM 等你贏!
🎯 關於 MinoTari (WXTM)
Tari 是一個以數字資產爲核心的區塊鏈協議,由 Rust 構建,致力於爲創作者提供設計全新數字體驗的平台。
通過 Tari,數字稀缺資產(如收藏品、遊戲資產等)將成爲創作者拓展商業價值的新方式。
🎨 活動時間:
2025年8月7日 17:00 - 8月12日 24:00(UTC+8)
📌 參與方式:
在 Gate廣場發布與 WXTM 或相關活動(充值 / 交易 / CandyDrop)相關的原創內容
內容不少於 100 字,形式不限(觀點分析、教程分享、圖文創意等)
添加標籤: #WXTM创作大赛# 和 #WXTM#
附本人活動截圖(如充值記錄、交易頁面或 CandyDrop 報名圖)
🏆 獎勵設置(共計 70,000 枚 WXTM):
一等獎(1名):20,000 枚 WXTM
二等獎(3名):10,000 枚 WXTM
三等獎(10名):2,000 枚 WXTM
📋 評選標準:
內容質量(主題相關、邏輯清晰、有深度)
用戶互動熱度(點讚、評論)
附帶參與截圖者優先
📄 活動說明:
內容必須原創,禁止抄襲和小號刷量行爲
獲獎用戶需完成 Gate廣場實名
OpenAI聯合創始人:自動駕駛和VR都是“歧途” AI智能體才是未來
作者:葛佳明
在黃仁勳和馬斯克接連看到了AI智能體的發展潛力後,OpenAI聯合創始人,特斯拉前人工智能總監Andrej Karpathy也在最近高呼,**AI智能體代表著一個瘋狂的未來。 **
Andrej Karpathy直言,自己在特斯拉的工作時“被自動駕駛分了心”,鑽研自動駕駛和VR都不是發展AI智能體的正確道路。此刻正是回歸神經科學,從中尋求靈感的時刻。
另一方面,Andrej Karpathy認為每個人在構建AI智能體的方面都比OpenAI這樣的公司更有優勢,大家目前處於平等競爭的狀態,因此他很期待看到這方面的成果:
谷歌旗下AI團隊DeepMind的最新論文介紹了一種能夠進行自我改進的AI智能體——RoboCat,本質上是由AI賦能的軟件程序,相當於機器人的“大腦”。由其加持的機器人與傳統機器人不同之處在於,RoboCat更具“通用性”,並可實現自我改進、自我提升。
具身智能比人形機器人更有價值
具身智能相當於AI的大腦,而這個大腦的載體可以是任何形式。可以是一個機械臂,一隻機器狗,更或者是一輛小汽車。
而反觀人形機器人,當下為何被看做是一個不太聰明的鋼鐵巨人,核心還是因為缺少AI大腦+不太靈活的軀體。
簡單來說,類似GPT-4這樣的大模型,對物理世界並不能真的產生影響,而具身智能則多了一個身體,通過傳感器收集環境信息,利用機械執行器進行物理操作,或者通過機器人等具體實體與人類和環境進行實時互動。
馬斯克曾說,雖然未來有一天人人可能會擁有一個人形機器人,但是目前展現的Optimus人形機器人產品也就只能執行重複性的簡單勞動。
具身智能的目標是使機器能夠更好地理解和適應複雜的環境,更高效地解決問題,並具備更靈活的行為能力。通過融合感知、決策和執行的過程,具身智能使機器能夠更接近人類智能的表現,從而在機器人技術、自動駕駛、智能製造等領域發揮重要作用。
Karpathy直言,在7年前,研究AI智能體的時機還不成熟,因技術所限做出來的效果不好,於是他和OpenAI就改變了方向,開始研究大語言模型。
而現在有了全新的技術手段來研究AI智能體,情況和2016年完全不同了:
AI下一個浪潮?
大語言模型的出現,給構建具身智能體帶來了全新的可能性。因為基於LLM的智能體可以利用預訓練模型中蘊含的世界知識,生成一致的行動計劃或可執行策略,這就非常適合應用於遊戲和機器人之類的任務。
DeepMind的RoboCat只是AI賦能機器人的主要案例之一。
今年以來,已經有數家公司將語言模型運用到了機器人上:2023年年初,谷歌推出視覺語言模型PaLM-E,並運用到工業機器人上;4月,阿里巴巴將千問大模型接入工業機器人;5月,特斯拉人形機器人Optimus展示了精準的控制、感知能力,同月,英偉達發布全新自主移動機器人平台。
得益於此,人工智能加持的機器人化身俱身智能吸引了全球的廣泛關注。
馬斯克在特斯拉2023年股東大會上便表示,人形機器人將是今後特斯拉主要的長期價值來源:
英偉達創始人黃仁勳在ITF World 2023半導體大會上也表示,AI下一個浪潮將是“具身智能”。華爾街見聞此前指出,國盛證券分析師認為,具身智能有著物理反饋、物理輸出的特性,可以成為成為通信、計算和存儲的新載體:
AI的軀體其實並非是最重要的,核心應該是發展AI大腦,打通人機交互方式,讓AI能夠主動感知物理世界,擬人化的思維路徑才能做到人類期待的行為反饋。機器視覺和多模態大模型正是開啟這個世界的兩把鑰匙。