위로가기 버튼
오피니언

불완전한 시선

전재영 한동대 교수·AI융합교육원 ‘데이터의 시선’이라는 제목을 처음 받았을 때 나는 잠시 헷갈렸다. 데이터를 바라보는 나의 시선인지? 아니면 나를 바라보는 데이터의 시선인지? 예전에는 후자의 경우가 말도 안되는 이야기였겠지만, 지금은 데이터가 나보다 나를 더 잘안다고 말하는 시대이기에 어쩌면 후자가 더 맞을 지도 모르겠다.영국 주간지 이코노미스트는 “세상에서 가장 중요한 자원은 더이상 원유가 아니라 데이터”라고 말했다.“알고리즘에 낚여서”라는 말을 우리는 이제 너무 쉽게 하지만, 그 알고리즘은 사람의 행동과 말과 글을 관찰하고 모은 데이터에 기반한 것이라는 것을 우리는 알아야 한다. 데이터 없는 알고리즘은 기름 없는 자동차와 같은 것이다.지금 빅테크 기업들은 사람의 언어를 이해하는 기계를 만들기 위해 언어모델이라는 것을 만들어내고 있다. GPT, BERT, 그리고 최근 ChatGPT까지. 그리고 그 성능은 우리를 놀라게 했다. 질문에 대한 답을 하는 것은 물론이거니와 인간처럼 시를 쓰고 심지어는 코딩까지 해준다.언어모델개발을 초간단하게 설명하자면 이렇다. 사람들이 작성한 온라인상의 수많은 글들을 Wikipedia, Fox News, CNN News 같은 사이트로부터 수집한 후, 이것을 인공지능을 학습시키는 훈련데이터로 사용하게 된다. 대표적인 훈련 방식은 주어진 문장에서 한 단어를 고의로 제거하고 그 제거된 단어를 예측하도록 컴퓨터를 훈련시키는 것이다. 그리고 이렇게 예측되어진 여러 개의 단어들 중 확률이 제일 높은 단어를 답으로 제시하게끔 하는 것이다.우리는 여기서 중요한 점 하나를 짚고 넘어가야 한다. 인공지능 언어 모델을 만들기 위해 사용하는 훈련 데이터, 즉 우리 인간이 온라인상에서 생성한 글들이 항상 온전하지만은 않다는 것이다. 우리 인간의 부족함과 불완전함, 우리의 선입관과 차별주의적인 편견 및 정치적인 색깔까지 고스란히 스며들어 있는 것이 우리 사람들의 글이기 때문이다.그런 불완전하고 편견을 가진 글을 훈련 데이터로 사용해서 학습된 인공지능 모델은 어쩔 수 없이 편견을 가진 답을 할 수밖에 없는 것이다.인간이 가진 시선이 인공지능의 시선이 되는 것이다. 데이터는 우리 인간의 시선을 비추는 거울이 되는 것이다.범죄자 재범률을 예측해서 보석 석방을 승낙할 것인지를 판단하는 인공지능 프로그램이 아프리카 미국계인에게 인종차별주의적 결정을 내려 한 때 큰 기사거리가 되었었다. 우리의 잘못된 선입관이 그대로 인공지능에 반영된 하나의 사례이다. 인종차별 기계를 만든 셈이다.우리의 불완전한 시선은 불완전한 데이터를 만들어내고 불완전한 데이터는 불완전한 알고리즘을 만들어내며, 그런 데이터와 알고리즘은 우리를 불완전하게 바라볼 수밖에 없다. 이것이 데이터의 시선이다. 그리고 때로는 매우 파괴적인 결과를 도래하기도 한다. 완벽한 것을 창조할 수 없는 것이 인간이다. 내가 종교를 가지고 있고 신을 믿는 이유이다.우리의 디지털 행동이 데이터이고, 그 데이터가 인공지능을 만든다. 우리 모두가 인공지능 개발자라는 것을 잊지 말자.

2023-01-24

인공지능과 함께 사는: ChatGPT의 출현

김정현 한동대 교수·AI융합교육원 2022년 11월 30일, 미국 샌프란시스코에 위치한 인공지능 연구조직 오픈에이아이(OpenAI) 가 인공지능 기반의 언어 생성 모델인 챗지피티(ChatGPT) 서비스를 무료로 출시하였다. 해당 서비스는 출시 5일만에 100만명의 사용자를 달성하는 등 전 세계적으로 많은 주목을 받고 있다.혹자들은 “구글과 같은 전통적인 검색 서비스의 시대는 끝났다”라는 주장과 함께 검색 엔진의 새로운 미래기술로 챗지피티를 지목하고 있으며 가까운 미래에 챗지피티가 기존의 검색 서비스를 대체할 것이라고 내다보고 있다.과연 챗지피티는 어떠한 서비스이기에 이토록 많은 사람들이 관심을 보이는 것일까? 필자는 2020년 삼성전자 메모리사업부 소프트웨어개발팀과 지피티-2(GPT-2) 언어 모델을 활용하여 펌웨어(Firmware) 제품에 적합한 코드 자동 완성 기능을 개발하는 공동연구를 수행한 바 있다.당시에도 지피티-2 언어 모델의 성능에 놀라움을 감출 수 없었지만, 불과 3년이 지나 출시된 이번 챗지피티의 서비스를 필자가 직접 실험해보니 현재 많은 외신들이 해당 서비스에 대하여 대서특필하고 있는 이유가 쉽게 납득이 되었다. 실제로 필자와 같이 많은 이용자들이 해당 서비스를 실험해보고 다양한 후기들을 남기고 있다.가령, 사용자가 특정 질문을 했을 때 완성된 형태의 글로 답을 내놓는 경우, 컴퓨터공학 관련 종사자가 작성한 코드를 입력했을 때 해당 코드의 오류를 발견하고 수정된 코드를 제공하는 경우, 대학생들의 작문 숙제를 대신 수행해주는 경우 등 사용자가 입력한 정보의 여러 가지 맥락과 조건을 고려해 맞춤형 대답을 어느 정도 적절하게 제공하고 있다.이제 인류는 기존의 검색 엔진을 통해 무엇인가를 탐색하고 스스로 답을 찾아가는 능력보다는 챗지피티와의 소통을 통해 적절한 질문을 하는 능력이 훨씬 더 중요하게 되었는 지도 모르겠다.챗지피티의 성공적인 데뷔로 많은 화제를 불러일으키고 있는 반면, 일부에서는 챗지피티의 악용에 대하여 촉각을 곤두세우고 있다. 실제로 미국 학교의 몇몇 학생들이 챗지피티를 활용하여 컴퓨터 관련 과제물을 해결하거나 작문과 관련된 과제물을 챗지피티를 활용하여 수행하고 있다는 사실이 많은 기자들을 통해 보도되고 있으며, 챗지피티가 한국어 서비스도 제공한다는 점에서 이러한 우려는 대한민국에서도 예외가 될 수는 없을 것이다.1956년 다트머스 학회를 통해 처음으로 ‘인공지능’이라는 용어가 소개된 이후로 인공지능 관련 기술들은 지속적으로 발전되어 왔다. 이러한 인공지능 기술의 지속적인 발전과 함께 가까운 미래에는 인공지능이 칼럼을 작성하는 시대를 맞이할지도 모르겠다.빠른 속도로 발전하고 있는 인공지능을 막을 수 없다면, 인공지능 기술이 인류에게 주는 다양한 혜택들을 누려보는 것은 어떨까? 가까운 미래에 인공지능 기술을 활용하여 칼럼을 수정하고 있는 필자를 그려본다.

2023-01-17

AI 시대의 평등

김경외 한동대 교수·AI융합교육원 4차 산업혁명 시대에서 디지털 전환은 선택이 아닌 필수 조건으로 자리매김하였다. 디지털 전환이라는 용어가 대다수의 사람들에게 그리 낯설지 않게 들리는 것처럼 이미 글로벌 시장에서 디지털 전환은 국가의 경제적 수준과 상관없이 빠른 속도로 일어나고 있다. ICT 기술을 중심으로 벌어지고 있는 이 변화의 흐름 속에서 우리 사회와 개인의 삶은 인공지능을 중심으로 하는 AI 시대에 적응해 가고 있다.AI 시대의 대표적인 특징 중 하나는 바로 데이터의 접근성과 기회의 측면에서 모두가 평등해진다는 것이다. AI 시대의 핵심인 ICT 기술의 발전은 지식의 비대칭성 문제를 해결하는 것을 넘어서 지식 공유를 통해 가치를 창출할 수 있는 환경을 만들었다. 이전에는 돈을 지불해야만 얻을 수 있었던 지식을 이제는 구글이나 유튜브와 같은 다양한 웹 서비스를 통해 무료로 빠르고 쉽게 얻을 수 있다. 또한 AI 시대에서는 가치 창출의 수단이 더욱 다양해졌다. 데이터는 더 이상 지켜야하는 대상이 아닌 공유의 대상이며, 데이터와 유휴 자원의 공유 활동을 통해 창출되는 경제적 파급력은 이미 우버나 에어비앤비와 같은 서비스들을 통해 입증되었다.이처럼 AI 시대에서는 이전보다 더 차별 없이 모두에게 공평한 기회가 주어지는 평등한 사회적 구조를 기대해 볼 법하다. 뉴욕타임즈의 칼럼니스트인 토머스 프리드먼이 그의 저서 ‘세계는 평평하다(The world is flat)’에서 설명한 것처럼 개발도상국가들의 비약적인 경제 성장과 이로 인한 세계 부의 평준화가 곧 이루어질 것으로 보인다. 온라인 서비스를 통해 국가와 지역간에 존재하던 교육과 정보의 불평등 문제는 이미 상당 부분 해소되어가고 있다.하지만 우리 사회의 불평등은 조금도 나아질 기미가 보이지 않고 오히려 심화되는 모습이다. 원격 교육이나 원격 근무가 기술적으로 활용 가능함에도 불구하고 여전히 청년들은 해외 선진국이나 대도시로 떠나려고 한다. 아직 완전한 AI 시대가 도래한 것이 아니라고는 하지만, 우리 사회의 상당 부분이 디지털화되어 있다는 사실을 미루어 보면 이는 우리가 낙관하는 AI 시대의 모습이 아니다. 이는 현 시점의 우리 사회가 AI 시대의 기술적인 장점만 있을 뿐, 이외의 가치를 구현할 수 있는 환경 또는 문화에 대한 변화나 정책적 개선은 미비하다는 사실을 보여준다.2023년의 AI 시대를 준비하는 우리 기성세대들은 앞으로 우리 자녀들에게 AI 시대의 참 가치, 즉 보다 평등하고 차별 없이 기회를 부여받을 수 있는 환경과 문화를 만들어 주어야 한다. 오히려 지금 우리 사회에 시급한 것은 AI 중심의 산업 또는 RD 정책이 아니라 젊은 세대들에 초점을 맞춘 정책 또는 시스템 개선이 아닐지 모르겠다. AI 시대의 평등은 결코 당연하게 주어지는 것이 아니라는 사실을 기억하면서 우리의 젊은 세대들이 보다 차별 없이 자유롭게 역량을 발휘할 수 있는 세상이 도래하길 기대한다.

2023-01-10

2023년, 대한민국의 첫 과제

이상산 한동대 교수·AI융합교육원장 새해를 맞은 대한민국, 국가적으로 가장 중요한 과제가 무엇일까 생각해 보자. 얼마 전 포항시에서 인구가 50만명 아래로 떨어지는 것을 막기 위해 거주자의 주민등록을 포항시로 옮기는 사업을 추진했었다. 반짝 증가하던 인구는 계속 감소하여 결국 지난해 6월에 50만 명 선이 무너졌다. 지역소멸의 문제가 심각하다.최근 통계청의 데이터는 더 근본적인 문제를 드러내고 있다. 2012년 1.30에서 시작해 1.19, 1.20, 1.24, 1.17, 1.05, 0.98, 0.92, 0.84, 그리고 작년 0.81. 지난 10년간의 우리나라 합계출산율이다. 합계출산율이란 여성 한 명이 평생 낳을 것으로 기대되는 평균 출생아의 수를 나타낸다. 합계출산율이 1인 사회는 남녀가 결혼해 한 아이를 출산하는 사회이다. 또 그 아이는 자라서 다른 부모가 출산한 한 아이를 만나 결혼해 또 한 아이를 출산한다. 이 사회에서는 양육의 부담을 축소한 대가로, 윗 세대를 부양하는 부담은 세대를 거듭하며 기하급수적으로 증가한다. 기존의 생활방식, 도덕과 가치로는 이 사회를 유지할 수 없다. 위기의 사회다. 그런데 우리 사회는 이미 이 단계를 넘어섰다. 그래서 소득수준이 높아졌지만, 구성원들의 행복 지수가 떨어지고 정신건강은 악화되고 있다. OECD 국가 중 최고라는 우리나라 자살율이 그 대표적인 지표이다. 이런 사회에는 미래가 없다.이 문제의 원인을 여성에게서 청년 세대에게서 찾으려는 노력이 많다. 그러나 근본적인 해결을 위해서는 문제를 그들에게서뿐만 아니라 그들이 처한 환경에서도 찾아야 한다. 이러한 관점에서 살펴볼 두 번째 통계청 데이터는 2021년 광역지자체별 합계출산율이다. 최저는 서울시 0.63, 이어서 부산시 0.73, 대구시 0.79. 반면에 최고는 세종시 1.28, 이어서 전남 1.02, 강원 0.98. 인구가 밀집되고 소득수준이 높은 대도시에서는 출산율이 낮다. 출산과 양육에 대한 지원이 안정적인 세종시에서는 예외적으로 높다. 오늘도 경쟁적이고 개인화된 사회에서 고소득과 편의를 향해 청년들이 몰려가고 있다. 그런 청년들을 지금까지는 대도시에서 수용해왔으나, 이제 그 수용력이 포화에 이르고 있다. 건강하지 않은 사회는 지속가능성이 낮다. 청년들이 돌아와 경제생활을 하며 머물 매력적인 공동체가 전국 곳곳에 일어나도록 국가와 지방정부가 창의적인 제도와 정책을 준비해야 한다.2023년 우리 사회가 해야 할 첫 과제는, 지금의 청년들과 앞으로 태어날 세대들이 청년이 됐을 때 대한민국이 지구상에 존재할 수 있을 방안을 찾는 것이다. 그리고 그 첫 주춧돌을 놓는 것이어야 한다. 대한민국이 존재해야 경제성장도 사회정의도 자유민주도 민족통일도 의미가 있을 것이다. 시작을 한 해 더 늦추면, 회복과정에서는 두 해 이상의 고통을 다음 세대에 남기게 된다.청년들이 다시 꿈꾸고 활짝 웃는 사회, 그런 2023년 새해가 됐으면 좋겠다.

2023-01-03