AI (타 유튜브) AI 모델 학습이 인간 의존적일 수 밖에 없는 이유?

Oxc.suga
조회 수 466
2024.08.23. 21:28

https://youtu.be/OhmVV0SXGBY?si=yxEl69zRkorHFIm-

영상을 보고 궁금했던 점 하나가 해소가 되었습니다.

본질적으로 현재의 AI 모델은 정보를 인식하고 패턴화하여 새로운 정보 뭉탱이를 배설..하는 방식으로 구성됩니다.

그렇다면 이 과정을 반복시켜 외부로부터 정보 유입이 없는 무한한 성능 개선의 에스컬레이션이 가능하지 않을까하는 유치한 생각이 있었습니다.

결론은 그렇지 못합니다.

현대의 알고리즘은 데이터의 반복되는 훈련 과정에 의해 비가역적인 모델 손상을 초래할 수 있다는 것이 이 영상의 주입니다.

즉, 현행 AI 모델은 인간 의존적입니다. '신선한' 데이터 유입이 없다면 현행 AI 모델 대부분이 파멸할 가능성이 있다는 것입니다.

현재 저작권에 대한 의논 없이 무차별적으로 끌어들이고 재구성하는 정보들의 유입이 끊어진다면 반짝하고 지는 또 다른 기술 중 하나가 될 수도 있는 시나리오인 셈이죠.

이것은 마치 엔트로피와 유사한 것이라고 직관적으로 받아들여집니다.

밥을 먹고 처리하고 남은 물질에는 양분이 들어 있기에 그것을 먹고 다시 양분의 재흡수가 이론적으로는 가능합니다. 하지만, 어디까지나 양분은 한정적이고 그것만으로는 폐쇄계를 구축하기에는 부족합니다.

마찬가지로 학습/추론 데이터에서도 무형의 '수명'이 존재한다고 생각해도 무방할 것입니다.

		10
								
1등EricCartman
									2024.08.23. 22:58									
제 생각도 같습니다.
현재 AI의 본질은 새로운 것을 만들어내는 것이 아니라
그냥 기존의 정보를 긁어다가 인공지능인것처럼 보이게 포장하는 것이라고 봅니다.
그냥 데이터베이스를 방대하게, 빅데이터로 만들어서 거기서 그럴듯한 답변을 생성하는 것 뿐이지요.
그래서 한계가 있을 수밖에 없고 데이터들의 수집이 끝나고 나면 발전도 더뎌지고 답변의 한계도 올 것이며 더 이상 높은 성능의 칩셋도 별 필요가 없을 것 같다는 생각이 듭니다.

					 1
									
					[EricCartman]님의 댓글을 신고합니다.
					취소
					신고
					
글쓴이Oxc.suga
										 EricCartman 님께
				
									2024.08.23. 23:31									
AI의 본질은 지능이 아니라는 점에 동의합니다.
그냥 새로운 정보 창출이라는 점에서 본문에서 '정보싸개' 정도로 표현한 것이죠.
정보를 수집하는 새로운 방법이 나온다면:현행 방식인 인터넷 무차별적 크롤링보다 진보된 방식, 수명연장이 가능할지도 모르겠습니다. 사실 그것을 더 원하는 부류도 있을것이고요. 
 
AI 구현을 위해서는 단순한 정보 이론으로 접근하면 한계가 뚜렷하리라는 것이 저의 생각입니다.
지성을 갖는, 지능 구조;뇌와 신경계의 존재가 이미 알려져 있는데 그것에 대한 연구가 선행되지 않는다면 효율적으로 지성 구현은 거의 불가능하겠죠. 
이런 관점에서 칩셋 성능은 단순히 현행 방식의 '사소한' 개선점에 불과하기에 동감합니다.

					[Oxc.suga]님의 댓글을 신고합니다.
					취소
					신고
					
2등쌍피ㄷㄷ
									2024.08.23. 23:48									
맞기도 하고 틀리기도 하다고 봐요
사실 이 문제는 딥러닝 차원에서 볼 때, 결국 overfit에 대한 문제입니다. 데이터의 다양성이 적어지고, real-world와 거리가 발생하는 상황이죠. 사실 이 문제는 오래 전부터 AI를 개발하는 사람들에게 숙명과도 같았던 문제였습니다. 저 문제를 바꿔서 바라보면, 결국 한정된 데이터에서 그 이상의 성능을 내야 한다는 거고, 그건 기존의 AI가 갖던 방향성과 그리 다르지 않습니다.
사실 대부분의 연구실이나 모델 개발 회사들도 이 문제를 일찍부터 인식하고, "모델들이 만드는 데이터를 분류"하는 것을 목적으로 한 모델들을 개발해왔습니다. 결국, 문제 상황은 모델이 낮은 다양성의 출력을 내놓다는 거고, 결국 그 말은 특정 차원에서 공통된 패턴을 만든다는 거라 분류 모델들은 높은 정확도로 진짜 이미지를 분류해줍니다. 실제로 우리가 생각하는 "AI사진스럽다"라는 특징을 모델들이 생각보다 쉽게 잡아내거든요. 빅테크 기업들도 이미 이걸 계속 업데이트하면서 양질의 학습데이터를 얻고 있는 거고요. 어떻게 보면 adversarial 문제이기 때문에 아직은 판단을 보류해야 하지 않나 싶어요.

					 1
									
					[쌍피ㄷㄷ]님의 댓글을 신고합니다.
					취소
					신고
					
EricCartman
										 쌍피ㄷㄷ 님께
				
									2024.08.24. 00:09									
그런 점에서 AI는 딜레마에 처해 있다고 봐요.
지금 이대로라면 AI는 결국 차별적이지 못한, 여태까지 있었던 알고리즘과 크게 다를 바 없는 획일적인 답변을 내놓게 되는 결과가 나올텐데
그럼 이런 딜레마가 발생하게 됩니다.
 
AI가 동일한 질문에 대해
같은 답변을 내놓으면
사람들은 이거 순 깡통 아냐? 별로 쓸모없군.
이라고 생각할 것이고
동일한 질문에 대해 매번 다른 답변을 내놓으면
이거 일관성이 없네? 이래서 써먹겠어?
라고 하기 때문에 참 AI개발자들도 힘들 것 같습니다만 어쨌든 이게 가장 큰 한계점이라고 보이네요.

					 1
									
					[EricCartman]님의 댓글을 신고합니다.
					취소
					신고
					
글쓴이Oxc.suga
										 EricCartman 님께
				
									2024.08.24. 00:19									
현재의 LLM, 즉 AI라고 접근하는 인터페이스에 대해서는 사실 대화가 가능하다는 점으로부터 고평가가 되었다는 생각이 듭니다. 저건 지능이 없습니다. 아니, 지성이라고 부를만한 것이 있더라도 미미할 것입니다.
 
영상에서도 나오는 바이지만, 인간 대 인간으로 대화하는 것과는 달리, LLM의 매커니즘은 투명합니다. 다시 말해, 너무나도 단순합니다. 단어와 단어를 얼기설기 잇는 수준인 것입니다. 다만, 이렇게 밀도 낮은 지능에도 불구, 효용성이 있는 것은 단순히 다루는 영역이 방대하기 때문입니다. 인간으로서는 범접할 수 없는 정보의 용량으로 인해 특정 부분에서는 효용성을 드러낼 수 있는 것이라고 생각합니다. 
 
실질적인 지성을 구현하기 위해서는 학제간 연구가 필수적이라는 관점은 이러한 특성에서 비롯한 생각입니다. 

					 1
									
					[Oxc.suga]님의 댓글을 신고합니다.
					취소
					신고
					
쌍피ㄷㄷ
										 EricCartman 님께
				
									2024.08.24. 00:37									
그렇죠..실제로도 그런 부분이 제일 힘듭니다. BERT를 처음 접했을 때가 생각나는데, 그때만 해도 정말 경악스러운 성능이 나와서 다들 NLP는 끝났다는 말을 많이 나왔어요. 그러다가도 불과 몇개월만에 한계점들이 쏟아져 나왔고, 또 그것들을 해결하지 못해서 전전긍긍했던 기억이 있네요. 물론 그러다가 GPT로 대표되는 NLG의 시대가 왔지만요. 사실 모든 학문이 그렇겠지만, 그런 한계를 극복해가면서 발전하는 게 아닌가 싶어요. 

					 1
									
					[쌍피ㄷㄷ]님의 댓글을 신고합니다.
					취소
					신고
					
글쓴이Oxc.suga
										 쌍피ㄷㄷ 님께
				
									2024.08.24. 00:15									
제대로 이해했는가 모르겠네요 ㅋㅋㅋㅋㅋㅋ(너무 전문적이십니다.)
 
AI를 다루는 절대적인 기술력의 확보가 되지 않는 상황에서 멀티모달, 즉 다기능에 초점을 두면 데이터 활용의 효율(Raw/Rich 데이터 비율로 생각해도 무방하겠죠?)이 부족할 것일 것이고, 이 데이터 효율에 초점을 두기 위해 부분적이고 로컬적인 데이터 처리, 즉 데이터 처리 모델 구축도 염두에 두고 있다는 것으로 이해하고 있씁니다. 
 
저야 뭐 정보 처리 분야에는 문외한에 가까우니 AI가 구현하고자 하는 목표인 AGI 도달에 대해서 정보 처리 이론을 기반으로 한 연구 관점이 부족하지 않을까 하는 생각이 있습니다. 실질적으로 지성을 포함하는 회로인 인간 신경계 연구가 지성을 부여하고자 하는 목표에 가까워질 수 있는 방법이 될 수 있으리라고 생각하고요.
 
그러나, 이것만으로 한계가 부여되지는 않으리라는 생각도 동시에 듭니다. 생물학 분야에서 기초적인 감각 연구인 바이오 센서를 비롯하여 제가 생각하는 방법인 신경계 연구에도 현재의 딥러닝 모델이 개입할 여지가 충분하니까요. 인류의 감각을 보조하는 역할로서의 현재 AI 모델은 경쟁력이 있고 가치가 있다고 생각합니다. 
 
사실 지금껏 모델 학습을 위해 정보를 수집하는 과정에서 단순히 '딸깍' 이상의 공이 들어갔다고 생각하지 않습니다. 즉, 너무 쉽게 정보를 수집해왔던 것 뿐이고, 저 연구는 현재 AI 모델에 대한 메타적 관점일 뿐 방향성에 대한 인사이트를 제공하지는 않는 것 같습니다. 단지 앞으로 정보 수집을 하는 방법에 대해서 더 많은 궁리가 필요할 뿐이겠죠.

					 1
									
					[Oxc.suga]님의 댓글을 신고합니다.
					취소
					신고
					
쌍피ㄷㄷ
										 Oxc.suga 님께
				
									2024.08.24. 01:23									
맞아요. 실제로 많은 연구자들은 AGI의 궁극적 방향성을 지금과 같은 트랜스포머기반 스케일업에서 찾고 있지는 않다고 생각해요. 개인적으로도 지금과 같은 MLP-트랜스포머 구조만으로 AGI에 도달할 수 있는지에 대해선 조금 회의적이기도해요. 괜히 네임드급 석학들이 트랜스포머 개선보다 self-supervised 학습론쪽으로 방향을 틀고 있는 게 아니죠...
지극히 개인적인 사견으로는 저도 AGI에 대한 궁극적 해답은 딥러닝쪽에 있는 게 아니라, 인지과학에 있다고 생각해요. 결국 AGI에 대한 가장 러프한 합의점은 '인간의 사고 과정'이고, 결국 그 인간의 사고를 모사한다는 목표를 잡는다면, 그보다 먼저 '인간의 사고 과정'이 정확히 뭔지를 정의하고 규명하는 단계가 선행돼야 할 거에요. 그래야 그걸 정확하게 모사할 수 있는 거니까요. 그 점에서 말씀처럼 흔히 말하는 인지과학에서의 학제간 교류가 중요한 거고요. 실제로 오늘날 딥러닝의 모든 성과는 20세기초에 신경 전달 메커니즘을 발견한 것에서 비롯된 것이기도 하죠..

					 1
									
					[쌍피ㄷㄷ]님의 댓글을 신고합니다.
					취소
					신고
					
EricCartman
										 쌍피ㄷㄷ 님께
				
									2024.08.24. 11:32									
사실 인간이라는 생물은 지구가 생긴 이래로 수십억년의 생물 진화의 산물인데
그 수십억년과 비교하면 찰나의 순간에 인공지능이라고 불릴 수 있을만한 성과를 낸 것도 대단하긴 해요.
 
하지만 선생님 말씀처럼 진짜 AGI로 가기 위해서는 딥러닝으로 흉내만 내는 대신 진짜 인간의 인지구조를 모사할 수 있는 수단이 되어야 할 텐데
애초에 이 인간의 사고구조가 어떤 식으로 작동하는지 원리같은 것이 규명되지 않은 상태에서는
명확한 한계가 있다고 보여집니다.
 
선생님 말씀대로 인지과학이나 의학과의 연계도 중요할 것 같구요.
하지만 인간의 인지구조를 파악하는 것이 가장 어려운 일이니만큼 AGI로 가는 과정은 생각보다 더 오래 걸릴 것 같아요.
 
					[EricCartman]님의 댓글을 신고합니다.
					취소
					신고
					
3등wonder3
									2024.08.24. 14:43									
결국 뭐가 됐는 기본구조. 알고리즘의 구성과 설계가 중요합니다. 
거기서 뭔가 다른 방식으로의 접근이나 구조 개선이 이뤄지지 않으면 AI 하나 마나죠. 

					[wonder3]님의 댓글을 신고합니다.
					취소
					신고

에디터로 글쓰기

번호	분류	제목	글쓴이	날짜		조회 수
공지	AI	AI / 로봇 게시판 이용 수칙 240418 [4]	admin	24.04.18	3	246
	AI	(타 유튜브) AI 모델 학습이 인간 의존적일 수 밖에 없는 이유? [10]	Oxc.suga	24.08.23	4	466
287	AI	구글, AI 스튜디오서 프롬프트 갤러리 무료로 제공	BarryWhite	24.08.23	0	70
286	AI	아마존: AI 도구로 시간 절감…50일치를 몇 시간으로	BarryWhite	24.08.23	0	104
285	로봇	팔굽혀 펴기하는 아틀라스	BarryWhite	24.08.23	0	166
284	AI	Z세대: AI 사용, 유용하면서도 죄책감 들어 [1]	BarryWhite	24.08.22	0	259
283	AI	맥아피, AI 딥페이크 탐지 도구 공개	BarryWhite	24.08.22	0	53
282	AI	사망한 배우 AI로 생성...에이리언: 로물루스	BarryWhite	24.08.22	1	280
281	AI	앤트로픽, 美 작가들에게 저작권 침해 집단 소송 당해	BarryWhite	24.08.21	0	82
280	AI	엔비디아, 게임 캐릭터 대화 혁신 이끌 AI 모델 공개	BarryWhite	24.08.21	0	162
279	AI	생성형AI로 폭풍 찾는다…엔비디아, 스톰캐스트 공개	BarryWhite	24.08.20	0	76
278	AI	오픈AI: 챗GPT로 허위 정보 유포한 이란 계정 차단	BarryWhite	24.08.19	0	103
277	AI	미드저니, 웹용 이미지 편집기 공개	BarryWhite	24.08.19	0	70
276	AI	메타 라마 3.1 미세 조정한 에르메스3 등장	BarryWhite	24.08.19	0	99
275	AI	긱벤치 AI 등장	BarryWhite	24.08.16	0	202
274	AI	中 AI 챗봇 토키, 美서 인기	BarryWhite	24.08.16	0	94
273	AI	신장결석 수술로봇 중 세계 첫 AI 탑재	BarryWhite	24.08.15	0	104
272	AI	광복절에 적절한 영상 [1]	곰장수	24.08.15	1	192
271	AI	실험 및 논문 작성해주는 AI 사이언티스트 등장	BarryWhite	24.08.14	0	111
270	AI	美, AI로 시험관 아기 시술 자동화 도전	BarryWhite	24.08.14	0	57
269	AI	모든 업무를 음성으로…구글, 제미나이 라이브 공개	BarryWhite	24.08.14	0	65
268	AI	내가 강력한 지성을 가진 AI에게 시키는 것 [1]	Alternative	24.08.13	9	444
267	AI	인간 능가하는 AGI, 인류 마지막 발명품 될 수 있어 [2]	BarryWhite	24.08.13	0	185
266	AI	오픈AI, LLM 생성 형식 불일치 문제 해결	BarryWhite	24.08.13	0	88
265	AI	NIA, AI모델 성능 평가 전면 재편···추론·감성 등 9개 지표 사용	BarryWhite	24.08.13	0	64
264	AI	구글, 제미니 1.5 플래시 사용료 최대 78% 대폭 인하	BarryWhite	24.08.12	0	140

👩🏼‍💻미코☀️

AI (타 유튜브) AI 모델 학습이 인간 의존적일 수 밖에 없는 이유?

추천 IT 소식 [1/]

스킨 기본정보

사용자 정의

1. 게시판 기본 설정

2. 글 목록

3. 갤러리 설정

4. 글 읽기 화면

5. 댓글 설정

6. 글 쓰기 화면 설정