久久久国产一区二区_国产精品av电影_日韩精品中文字幕一区二区三区_精品一区二区三区免费毛片爱

 找回密碼
 注冊會員

QQ登錄

只需一步,快速開始

搜索
查看: 2505|回復: 3

太獵奇了,首個GPT-4驅動的人形機器人

[復制鏈接]
1#
發(fā)表于 2023-12-22 14:02:55 | 只看該作者 |倒序瀏覽 |閱讀模式
本帖最后由 twq19810302 于 2023-12-22 14:05 編輯
9 J' J; n* M+ U" E6 }
6 m; f  Y8 P6 |8 `  H讓GPT-4操縱人形機器人,事先不做任何編程or訓練,能搞成啥樣兒?" M* @* J3 O* E6 }& m4 e

; E3 ]: X8 v. [0 r答案是:太 獵 奇 了
% y) J1 p% s- P

$ B- X$ z" C- ]這不,要求機器人表演“在昏暗電影院里狂炫爆米花,卻突然發(fā)現(xiàn)吃的是隔壁陌生人的😅”。, N, C% J! Y8 X9 F4 |" X* E

( T8 d! C) v. Q6 G. b4 E在GPT-4的操縱下,機器人笑容凝固,“尷尬”得搖頭扶額后仰:9 {  U9 u$ x: i( W/ W% @, E
; u+ _% V! z" }. X0 x

. ]6 a+ @* V, `. F3 R: P: y
; P! t" J2 Q0 y, R! c
但在尷尬之余,竟然還不忘再抓一把塞嘴里???又像是要求機器人“彈吉他”。
- \' o% z% D$ w: J) Z, [3 r

7 S) N" S. B- y' X/ p# ~  WGPT-4略思考一番,開始操控機器人活動一番手指、隨后瘋狂甩頭,好像是有點搖滾內味兒。但仔細一看,甩頭的時候,手指就完全不動了……
! j' `- h+ _" [( X% j* _; u+ J

( o/ e* g/ F8 t1 C% H' R3 U  `' i1 a" S. W& O
你要說這是神叨叨的地攤先生在掐指一算,好像也沒什么不對(手動狗頭)。' G" k; p* }( S2 i6 |; @9 J- A& A

/ m1 z  _: e4 c6 c+ x8 J. m+ J總結一系列動作來看——
1 C1 x  x  S1 s0 H4 ^, F% n
0 I" }; O% D/ y
相比波士頓動力人形機器人,一舉一動均由人為程序精細操縱,這個GPT-4直接操控的機器人,表情猙獰,動作詭異,但一切行為又符合prompt的要求。
5 \, H# p" D- j3 E# ^4 J

1 }. E: A) j$ T! F

1 m5 ?* o# L$ {2 A# Z
3 X7 w8 D5 Z' R* B, @5 r5 ~
這一連串GPT-4操控機器人的視頻po到網(wǎng)上后,不少網(wǎng)友直呼“恐怖谷效應犯了”:4 [6 f7 s/ z, y! `) z  k
* U, ]% _5 ?' ~0 @; w
原來,這是首個由GPT-4驅動人形機器人的研究,來自東京大學和日本Alternative Machine公司。
0 {7 w, T" e& j
3 [% f: T% k1 h# x1 A9 M( a
, L2 S& L  d5 n: {3 @5 C- i
依靠這項研究,用戶無需事先給機器人編程,只需語言輸入、也就是動動嘴皮和GPT-4聊上一會兒,就能讓機器人根據(jù)指令完成行動。( A; J/ H1 s5 C9 L$ N( l, f6 J7 C

$ |7 ~: i" j$ y0 y( ^8 e/ R
0 Q. y) @# U( w) l1 \6 C7 W
9 @. H1 s7 A; \! e4 T+ w' m
來具體講講把GPT-4和Alter3集成到一起,是如何實現(xiàn)的。2 k/ e. k- K, b& Q1 M+ G( N6 Y
; J/ T; e- r% F) A  m* v: g1 @
大體可以分為兩個步驟:5 N+ i$ J  [2 n( A
' I3 ?# e) W% x7 {
首先,先用prompt描述一下,想要Alter3能夠完成什么行為或者動作,比如“咱來張自拍吧”“自拍的時候胳膊再舉高一點”。
# H( z/ g1 u5 O
$ U1 t* z* X) h% ^; c, y
接收到輸入的GPT-4會生成一系列的思考步驟,這些步驟詳細地闡述了要完成這個動作,需要先后完成些啥。
0 V4 N* f4 b  c# G
6 ^& l1 T+ Y2 O/ ?7 T) c# L$ q! o
這個過程被研究團隊稱為CoT的一部分,即將一個復雜任務分解為一串更簡單的思考步驟。9 ~( s0 C) V+ t2 A
7 O4 h; M+ q% f* N* Z
然后,研究者們再祭出另一個prompt,把分解后的詳細步驟轉化為Alter3可以聽懂的動作指令。5 h" x- ?& Q2 ?+ Q
2 r) s2 i4 r8 i  `2 H1 @/ y7 w
簡單理解就是把人們的指令描述轉化為Python代碼,這些代碼可以直接用來控制Alter3的各個身體部位的具體運動參數(shù)。
+ v7 c9 ^; \! G
, e$ Z% T8 `) g4 f) l4 z
有了轉化后的代碼,Alter3想擠眉弄眼就擠眉弄眼,想撇嘴就能撇嘴/ p( h, G( n! E$ |3 Y# D. a
" c* c5 e* R% n; I2 {" Q% j
研究團隊把這第二步也看成CoT的一部分,因為它完成的是“把一個抽象描述轉化為具體操作”。
$ |  J( B: q1 i& Q

4 ~6 M8 z1 o" J

: j3 J$ T; {! ?+ |/ d& l6 u& f7 Z% ?& E2 v1 K0 o
團隊表示,CoT讓GPT-4能夠有效控制Alter3,命令它做各種復雜動作,且不用額外的訓練或者微調。8 Q0 g2 V) G' Y1 _" b$ f* {
2 p6 S4 Z! r/ H7 z% o
多說兩句,除了上述的兩個Prompt搞定機器人控制外,研究團隊還順手完成了一些其它研究。+ d8 M8 d. X0 G5 ]7 N
5 m+ R) ]. ~5 Y& G! H- }+ Z/ D
比如掰開了看Alter3在對話中的行為,主要針對其對話軌跡語義時間演化
% I, R. v( v+ J( [
& h1 \+ f( I9 z5 J. N6 V; j& R
針對對話軌跡,研究團隊使用了一種叫UMAP(Uniform Manifold Approximation and Projection)的方法。團隊把對話內容嵌入二維空間,從而方便觀察這個簡化版的對話發(fā)展過程。% s% w5 Z2 i! C% @

3 S" h$ d8 a! o" d+ s" Z$ u他們發(fā)現(xiàn),當對話順序固定時,對話軌跡會呈現(xiàn)循環(huán)模式,也就是老在重復同樣的話題。9 x. K+ C% x0 A: V$ U9 }% F

5 m0 j+ k9 W. L/ M- R4 v而當對話順序隨機時,對話內容更有發(fā)散性or創(chuàng)造性。+ |4 g9 D9 P0 x- k

& |' d: ]6 q; i" y+ D. g賊有趣的一點,研究發(fā)現(xiàn)GPT-4聊久了過后,會傾向于反復說“再見”。如果你不來點兒人為干預,它就會沉迷于想辦法跟你說再見。

0 S; \1 [! o; g) ?  G) W# y3 v" V, V  @, w& L6 p
而做語義時間演化分析的過程中,團隊觀察了隨著時間變化,聊天內容的變化。3 H3 i+ f, W: {+ F; p7 l( O: \
! }4 b5 L% Q" O3 F# V
他們發(fā)現(xiàn),對話初期的一些關鍵詞,比如“藝術”或者“學習”啥的,會聊著聊著就被GPT-4忘了,取而代之的是諸如“文化”“人類”“抑制”之類的詞。9 c+ n" G6 J1 w& v' I+ A! q- x

0 v" Y/ w6 s# U" c. N這表明對話內容是在逐漸發(fā)展變化的。& A9 ^( H4 n% i# d9 L" _. H+ b/ u+ q

- M1 g5 B/ Z1 c# V/ \當然,如果你開始跟GPT-4說“再見”,它就幾乎一心一意只想跟你說byebye~(doge)
- ^! ^* ^# M* n" y( L  W; f- f

# k2 X% |" J* U6 [4 l3 w  ~3 D% t: Q這項火爆全網(wǎng)的研究,來自東京大學和日本Alternative Machine公司。; N1 [  e' L" R2 H& _

6 O& G$ d4 b: k& p/ q# t一作Takahide Yoshida,來自東京大學通用系統(tǒng)科學系。
1 u% p$ Y% e2 d/ H1 t$ `
( k: Z$ d* I0 Z( Z- {. P
另外兩位作者升森敦士(Atsushi Masumori)和池上高志(Takashi Ikegami),都是既在東京大學,又屬于Alternative Machine公司。

# a$ ?4 `. S# q2 Z+ t+ Y9 l/ e5 `9 _1 l$ K8 t

! V* L- w0 M% b9 y! {2 @; B% g( V
最后,不得不提到本次研究內容的主人公Alter3,它的幕后研究者也來自東京大學,由東京大學AI研究學者池上高志和日本“機器人之父”石黑浩聯(lián)袂打造。) [6 M2 h6 t4 M7 D

0 I1 ~4 e9 j3 Q( @  {! _2 c' |8 `Alter3出生于2020年,是同系列機器人第三代產(chǎn)品。0 N$ t7 X8 ~- Q' |/ e; t5 ^2 K7 s+ Z

0 m4 w/ j+ q* u4 E據(jù)了解,Alter系列的兩次迭代都是在歌劇演唱中完成的。第3代的初亮相就是在東京新國立劇場指揮管弦樂隊并參加其他現(xiàn)場表演。

  u; s0 }* i+ [4 j) {# g% t' W+ Y" H4 i( y: e  O5 W$ Q

7 L% i- [0 x1 x4 l* f: A6 W5 w! m" ]5 U
那個時候它的特色是增強了傳感器,并改善了唱歌的表達能力和發(fā)聲系統(tǒng)。4 o; L$ O& q6 E6 M3 c

, F) Z: j3 z. B- T以及身體里那粒能夠最終驅動43個氣動裝置的CPG。: b" K0 K# y3 K' t
5 k4 V. m- M, Y
CPG對數(shù)據(jù)的分析靈敏到什么程度呢?就是如果Alter3呆的房間里如果溫度驟降,Alter3會因此打個冷顫,表示自己有被冷到。
* Y2 |. b& y/ a
; ]% {( i# c8 l$ D! F2 N9 _1 C7 m/ h

6 ^. b4 @' W4 z5 O/ K( C這或許也為現(xiàn)在接入GPT-4當腦子后的它,能夠活靈活現(xiàn)做表情、完成動作提供了一些基礎吧。' R/ s& j, f& ?  p' F
3 s' I# \* T8 L$ V2 \6 q- U: \- a
7 `. b6 S0 n5 ^4 W: u& o$ h4 m0 A
回復

使用道具 舉報

2#
發(fā)表于 2023-12-22 15:34:10 | 只看該作者
感覺能看到N年后的一點影子了,AI迭代下去智能提升,控制機器軀殼
3#
發(fā)表于 2023-12-22 15:54:59 | 只看該作者
紫衣青衫 發(fā)表于 2023-12-22 15:34
% H2 S/ [8 B$ J- t( }0 Y' K感覺能看到N年后的一點影子了,AI迭代下去智能提升,控制機器軀殼

/ o" j. f* q% c  X4 O( Q同意,現(xiàn)在看上去還是智障,將來還是會越來越智能的' o: M1 d# l1 a2 Y5 P! }/ `
4#
發(fā)表于 2023-12-26 08:42:40 | 只看該作者
厲害!科技的力量正在成長
您需要登錄后才可以回帖 登錄 | 注冊會員

本版積分規(guī)則

Archiver|手機版|小黑屋|機械社區(qū) ( 京ICP備10217105號-1,京ICP證050210號,浙公網(wǎng)安備33038202004372號 )

GMT+8, 2025-7-19 12:54 , Processed in 0.080858 second(s), 14 queries , Gzip On.

Powered by Discuz! X3.5 Licensed

© 2001-2025 Discuz! Team.

快速回復 返回頂部 返回列表