久久久国产一区二区_国产精品av电影_日韩精品中文字幕一区二区三区_精品一区二区三区免费毛片爱

機(jī)械社區(qū)

標(biāo)題: 太獵奇了,首個GPT-4驅(qū)動的人形機(jī)器人 [打印本頁]

作者: twq19810302    時間: 2023-12-22 14:02
標(biāo)題: 太獵奇了,首個GPT-4驅(qū)動的人形機(jī)器人
本帖最后由 twq19810302 于 2023-12-22 14:05 編輯
2 _% [' \0 N( M8 J0 ]1 J* M
& S2 {; I9 a) e3 v& b2 k# ]讓GPT-4操縱人形機(jī)器人,事先不做任何編程or訓(xùn)練,能搞成啥樣兒?- I0 ^2 q6 z) k; t6 G) a8 D9 s
) P% c. g* P. F8 c
答案是:太 獵 奇 了" D( U/ f' S7 [: [7 y% U
8 R$ ^8 ?, l5 A# a+ c
這不,要求機(jī)器人表演“在昏暗電影院里狂炫爆米花,卻突然發(fā)現(xiàn)吃的是隔壁陌生人的😅”。
( p" |, |1 M  ^6 I& M, c

( Y3 W; S$ ]; n, e9 C, i在GPT-4的操縱下,機(jī)器人笑容凝固,“尷尬”得搖頭扶額后仰:$ z  R/ {# l, {$ p7 l
8 L* Z2 G) }) O/ z( S9 O$ K$ t2 K- ^

6 m. p- _$ O3 |7 y9 m1 u  v$ r4 e: G- i- a2 y! z7 _
但在尷尬之余,竟然還不忘再抓一把塞嘴里???又像是要求機(jī)器人“彈吉他”。5 b& B" _  v5 g9 g# F4 A& r

5 n5 \+ D( m, D: h6 S6 nGPT-4略思考一番,開始操控機(jī)器人活動一番手指、隨后瘋狂甩頭,好像是有點搖滾內(nèi)味兒。但仔細(xì)一看,甩頭的時候,手指就完全不動了……
2 I4 g. p2 E; I1 z) A3 J6 V& i
9 m* _- b" {' F5 c
2 }( D4 R* }# W* A  a& \3 G# q1 E) Q
你要說這是神叨叨的地攤先生在掐指一算,好像也沒什么不對(手動狗頭)。
- a$ `2 e" I$ k3 C% t
9 G6 e/ c/ C+ {  y$ e2 U
總結(jié)一系列動作來看——+ G, h) ?5 O2 K

; k- a+ E/ }5 N/ v& w' e相比波士頓動力人形機(jī)器人,一舉一動均由人為程序精細(xì)操縱,這個GPT-4直接操控的機(jī)器人,表情猙獰,動作詭異,但一切行為又符合prompt的要求。

/ h) O1 `" h4 y1 G' Q3 J9 o: N) o3 [9 v
: x/ b' j$ r, x4 K- D3 S
8 S/ ?& h4 Q# r
這一連串GPT-4操控機(jī)器人的視頻po到網(wǎng)上后,不少網(wǎng)友直呼“恐怖谷效應(yīng)犯了”:
& n. W" F" q# X  T

+ @8 W- u4 k/ G/ W6 L
原來,這是首個由GPT-4驅(qū)動人形機(jī)器人的研究,來自東京大學(xué)和日本Alternative Machine公司。

; e; }. S; Z5 U

7 b1 l9 _4 q& f* \# R0 O3 {% e! x
依靠這項研究,用戶無需事先給機(jī)器人編程,只需語言輸入、也就是動動嘴皮和GPT-4聊上一會兒,就能讓機(jī)器人根據(jù)指令完成行動。
% `; H( A# P: m2 m+ A6 B- \* n9 c
4 V: K5 G/ ~1 z
- E( Y3 u9 n0 j, M, `

4 k0 \% N' i( `5 d
來具體講講把GPT-4和Alter3集成到一起,是如何實現(xiàn)的。& p; o  R4 t1 \' q4 r4 g' R" A
3 H$ _; L7 ~0 p3 W  d
大體可以分為兩個步驟:- j( e& d4 M* y) U6 n$ x
+ U! |0 J: {2 T  p$ s' I
首先,先用prompt描述一下,想要Alter3能夠完成什么行為或者動作,比如“咱來張自拍吧”“自拍的時候胳膊再舉高一點”。
" ^! V. b9 W1 F) z7 _3 e

. Z8 \. u7 F( _4 Q( f/ f: p. q: D/ T接收到輸入的GPT-4會生成一系列的思考步驟,這些步驟詳細(xì)地闡述了要完成這個動作,需要先后完成些啥。9 g; j& K+ |' @

  Y! j/ g+ n/ h( g, e  B" v這個過程被研究團(tuán)隊稱為CoT的一部分,即將一個復(fù)雜任務(wù)分解為一串更簡單的思考步驟。, @  T, v, `# V/ l! y

& c1 `/ S; o! Z. g* G3 ^然后,研究者們再祭出另一個prompt,把分解后的詳細(xì)步驟轉(zhuǎn)化為Alter3可以聽懂的動作指令。
# ~3 C5 i% T* i! i+ L* F9 y

9 V# ?( k* X) \5 N- g# ?: F& @簡單理解就是把人們的指令描述轉(zhuǎn)化為Python代碼,這些代碼可以直接用來控制Alter3的各個身體部位的具體運(yùn)動參數(shù)。
2 ^' }( M& Z8 {1 O  K, }! l
% j6 m; V. ^  u  r
有了轉(zhuǎn)化后的代碼,Alter3想擠眉弄眼就擠眉弄眼,想撇嘴就能撇嘴
! e" N' E7 a0 e& c  F+ o
  [" L. M6 A, P+ l
研究團(tuán)隊把這第二步也看成CoT的一部分,因為它完成的是“把一個抽象描述轉(zhuǎn)化為具體操作”。7 T5 {8 z7 }# n" B% {
% n! D2 [) a8 N& w7 {

9 q, w* L( `2 o- l* \; g5 }$ A& Q: [! s! V4 ^
團(tuán)隊表示,CoT讓GPT-4能夠有效控制Alter3,命令它做各種復(fù)雜動作,且不用額外的訓(xùn)練或者微調(diào)。% ~& w% @( r% E: h3 B5 y0 c7 c
& @- Q+ U8 ~( z9 z+ s+ K
多說兩句,除了上述的兩個Prompt搞定機(jī)器人控制外,研究團(tuán)隊還順手完成了一些其它研究。
6 l) G0 W( M3 a/ Z* m4 ~

- m2 B+ G% T' |3 H; L7 d5 `' J比如掰開了看Alter3在對話中的行為,主要針對其對話軌跡語義時間演化。
( S# s8 f5 [" o, D. @
& L2 i2 E$ y% t+ l7 c! k
針對對話軌跡,研究團(tuán)隊使用了一種叫UMAP(Uniform Manifold Approximation and Projection)的方法。團(tuán)隊把對話內(nèi)容嵌入二維空間,從而方便觀察這個簡化版的對話發(fā)展過程。
0 T" e& I$ e3 n! _: A
: r" N9 @' p, j% W
他們發(fā)現(xiàn),當(dāng)對話順序固定時,對話軌跡會呈現(xiàn)循環(huán)模式,也就是老在重復(fù)同樣的話題。% d: M. T( L6 u- D" K& m- @2 o
- X! X- F. ?; {- p+ `# b
而當(dāng)對話順序隨機(jī)時,對話內(nèi)容更有發(fā)散性or創(chuàng)造性。
  F+ ~9 Q: y0 u! w! j$ U) [6 Z* B

* b. d3 U5 X5 c; j0 a( U. ~賊有趣的一點,研究發(fā)現(xiàn)GPT-4聊久了過后,會傾向于反復(fù)說“再見”。如果你不來點兒人為干預(yù),它就會沉迷于想辦法跟你說再見。
7 H& k, m3 v0 y+ u

- f, B; ^4 P! \/ V
而做語義時間演化分析的過程中,團(tuán)隊觀察了隨著時間變化,聊天內(nèi)容的變化。
/ J# G+ B, s1 D/ C
( a$ q5 {/ e( X4 H# E
他們發(fā)現(xiàn),對話初期的一些關(guān)鍵詞,比如“藝術(shù)”或者“學(xué)習(xí)”啥的,會聊著聊著就被GPT-4忘了,取而代之的是諸如“文化”“人類”“抑制”之類的詞。) W% R) c, o8 @. @

* J7 ~$ G8 V! J* s0 Z: z這表明對話內(nèi)容是在逐漸發(fā)展變化的。
9 Z: ]; R$ y5 c8 f

) _8 _/ @' {" L當(dāng)然,如果你開始跟GPT-4說“再見”,它就幾乎一心一意只想跟你說byebye~(doge). V6 Q0 W% g; g9 n3 _
6 |$ e8 f6 W$ |5 `( ~
這項火爆全網(wǎng)的研究,來自東京大學(xué)和日本Alternative Machine公司。
) G4 T/ G! v' `0 p. g4 l
1 X3 b: v7 p+ b; I' S, G
一作Takahide Yoshida,來自東京大學(xué)通用系統(tǒng)科學(xué)系。. v0 Y9 U7 {* J/ r
) o4 U# p* D! G, ~' l. H
另外兩位作者升森敦士(Atsushi Masumori)和池上高志(Takashi Ikegami),都是既在東京大學(xué),又屬于Alternative Machine公司。

+ }- J& k( \# e% \
# e. I  |. E6 W& `
/ c8 i+ V+ C: @% i; v  D
: @0 w( r& ~" [* _( A
最后,不得不提到本次研究內(nèi)容的主人公Alter3,它的幕后研究者也來自東京大學(xué),由東京大學(xué)AI研究學(xué)者池上高志和日本“機(jī)器人之父”石黑浩聯(lián)袂打造。9 n& [3 g6 |6 e/ _& ]# U3 o/ `' O
9 }& W+ T  {9 N3 |+ U1 x& B! b
Alter3出生于2020年,是同系列機(jī)器人第三代產(chǎn)品。
7 B$ L7 |: e6 Z3 J* }; j2 j# F

) m8 ?4 u/ D/ O5 m, A5 z據(jù)了解,Alter系列的兩次迭代都是在歌劇演唱中完成的。第3代的初亮相就是在東京新國立劇場指揮管弦樂隊并參加其他現(xiàn)場表演。

. e' ?9 z6 A) W0 ^  @0 U9 x, t! P2 y0 B5 a
  r/ t! [. q( a' |7 E% @9 Z

  s5 b2 `4 j( J8 ]2 D/ ]% y
那個時候它的特色是增強(qiáng)了傳感器,并改善了唱歌的表達(dá)能力和發(fā)聲系統(tǒng)。  D5 i/ ]1 X$ z$ ]( M; V; N

* ^- Y! x0 v/ i) a4 K2 n以及身體里那粒能夠最終驅(qū)動43個氣動裝置的CPG。
+ ]* I3 b8 E, D

8 z- U% j& i, [( B) uCPG對數(shù)據(jù)的分析靈敏到什么程度呢?就是如果Alter3呆的房間里如果溫度驟降,Alter3會因此打個冷顫,表示自己有被冷到。
+ m6 x2 c9 g+ I, P7 N: D
% B8 _, z1 R/ M* I
9 s; A1 T" F8 t- V$ n% i  o
這或許也為現(xiàn)在接入GPT-4當(dāng)腦子后的它,能夠活靈活現(xiàn)做表情、完成動作提供了一些基礎(chǔ)吧。* i6 h$ ~% @' w- l0 e8 S3 h  f# \

6 j; }. ~$ ^8 l: p( r
1 u; O- Q' ^% v  |2 ]1 f
作者: 紫衣青衫    時間: 2023-12-22 15:34
感覺能看到N年后的一點影子了,AI迭代下去智能提升,控制機(jī)器軀殼
作者: 喂我袋鹽    時間: 2023-12-22 15:54
紫衣青衫 發(fā)表于 2023-12-22 15:347 f7 A2 ^4 O6 h( b9 y! Y0 a
感覺能看到N年后的一點影子了,AI迭代下去智能提升,控制機(jī)器軀殼
7 c% J. ?# o, I; v+ R
同意,現(xiàn)在看上去還是智障,將來還是會越來越智能的
  f1 L( t: a$ T! A6 ]
作者: tiantianxs    時間: 2023-12-26 08:42
厲害!科技的力量正在成長




歡迎光臨 機(jī)械社區(qū) (http://www.ytsybjq.com/) Powered by Discuz! X3.5