주메뉴 바로가기 본문 바로가기

전자정부 누리집 로고 이 누리집은 대한민국 공식 전자정부 누리집입니다.

확대수치
글자크기 100%

개인정보 보호위원회

다시 대한민국! 새로운 국민의 나라

미래포럼 현장영상 게시판 상세 페이지

미래포럼 현장영상 게시판 상세페이지로 제목, 작성부서, 작성자, 작성일, 조회수, 첨부파일, 페이지 URL, 내용 등 정보를 제공

제목 제6차 「2022-2023 개인정보 미래포럼」 ('22.12.21.)
작성부서 혁신기획담당관 작성자 정윤식
작성일 2023-01-09 조회수 820
첨부파일 목록
페이지 URL
의장 윤종수 : [“안녕하십니까. 「2022-2023 개인정보 미래포럼」제6차 회의를 시작하겠습니다.
미래포럼 민간위원장을 맡고 있는 윤종수 변호사입니다. 어떻게 연말 잘 마무리하고 계십니까? 이제 며칠 남지도 않았고 정말 다사다난한 한 해였던 것 같습니다. 오늘 또 눈이 와서 고생하신 분도 계셨을 텐데 밤에 아마 추워진다는 것을 보니까 조심해야 할 것 같습니다. 아무튼 건강하게 한 해 마무리 잘하시고, 올해 6차이자 마지막 미래포럼을 진행하도록 하겠습니다.
오늘도 역시 온·오프라인으로 병행해서 진행될 것이고, 외부 인사로는 오늘 발표를 해 주실 하정우 네이버 AI연구소 소장님 그리고 이상호 KT AI Robot 사업단장 두 분이 참석하셨습니다.
그리고 오프라인에 많은 위원님들이 계시고, 온라인으로 윤영미 위원, 이옥연 위원이 참석하셨고, 그리고 서정아 대변인께서 오늘 또 처음으로 참석해 주셨습니다. 환영합니다.
그러면 우선 항상 깔끔하게 정리해 주시는 최경진 혁신지원단장께 5차 미래포럼 회의 결과 보고를 부탁드리겠습니다.”]

위원 최경진 : [“안녕하세요. 제5차 회의 결과 보고 말씀드리겠습니다.
2개의 발제가 있었는데 첫 번째 발제는 자율차를 중심으로 보는 자동차 산업의 현황과 과제에 대해서 굉장히 산업적 관점에서 현실을 잘 이해할 수 있게 발표가 있었습니다. 이것은 기존의 것을 한 번 보시면 좋을 것 같습니다.
이러한 현상에 대한 설명을 바탕으로 해서 자율주행차와 개인정보 이슈에 대해서 어떠한 것들이 우리가 고려해야 할 이슈인지를 살펴봤습니다. 특히 개인정보 보호법상 개인정보의 합법 처리 근거에 대해서 소개가 있었고, 이것을 바탕으로 자율주행차의 안전 운행을 위한 개인정보의 처리에 대한 법적인 규율 방안에 대해서 고민했었는데 이러한 기본적인 발표에도 불구하고 여러분들께서 지적하셨던 것처럼 자율주행차를 운행하는 과정에서 그리고 R&D 과정에서 막대한 개인정보가 필요한데 그 개인정보의 합법 처리가 실질적으로 보장되는지에 대한 의문이 제기되었습니다.
여러분들이 동일한 의문을 제기하셨습니다. 현행법상으로는 비식별 조치, 가명처리를 통해서 활용할 수 있지만 그것이 사실상 한계에 다다르고 있다는 지적도 있었습니다. 이러한 공통된 문제의식을 바탕으로 토론이 있었는데 특히 자율주행과 영상정보 관점에서 영상정보 처리가 많이 이루어지고 있는데 이러한 영상정보를 처리할 때 특히 실제로 원격으로 조작할 때는 더 많은 데이터가 필요로 하게 되는데 이러한 영상정보에 대해서 현행법상 비식별 조치를 통해서 할 수 있지만 그것을 넘어서서 연구 개발하는 단계에서 좀 더 전향적인 개인정보 처리에 대한 근거를 마련하는 것이 앞으로 우리에게 주어진 법적인 과제라는 주장들이 있었습니다.
더 나아가서 무인자동차뿐만 아니라 자율 이동체 전반에 대해서 이러한 산업을 활성화시키는 측면에서 개인정보 보호 이슈가 굉장히 중요하고 이런 개인정보 보호 이슈를 적절하게 다루기 위한 측면에서의 법·제도 개선이 필요하다는 말씀도 하셨습니다. 특히 개인정보 보호 이슈뿐만 아니라 전반적인 보안 문제도 함께 고민이 필요하다는 말씀들이 있으셨습니다. 개인정보 보호와 보안은 서로 굉장히 중요한 보완재이기 때문에 두 가지 모두 다 우리가 함께 고민해야 할 것 같습니다.
이어진 종합토론에서는 다양한 의견들이 있었는데 특히 공통된 문제의식과 함께 해결방안으로 자율주행차의 알고리즘 또는 자율주행 모듈을 업그레이드하기 위해서 중요한 것이 개인정보를 활용한 R&D인데 그 R&D만큼은 좀 더 개인정보를 전향적으로 쓸 수 있게 만들어주는 샌드박스 제도 또는 개인정보 보호위원회가 주도하는 특별한 제도들을 도입하는 것이 필요하지 않을까라는 주장이 있었습니다.
나아가서 개인정보 보호위원회가 아무래도 개인정보에 대한 컨트롤타워이기 때문에 데이터 샌드박스 제도가 도입된다면 개인정보 보호위원회가 그것에 대한 총괄 권한을 가지고서 일관성 있는 개인정보 규율 체계를 마련하는 것이 필요하다는 말씀이 있으셨습니다.
그리고 역시나 중복된 말씀이셨는데 실제 R&D 과정에서 비식별화라든가 가명처리 자체가 데이터의 가치를 상당히 떨어뜨리기 때문에 데이터의 가치를 떨어뜨리지 않고도 쓸 수 있도록 만드는 개인정보의 합법처리에 대한 결단이 필요합니다. 예를 들면 Opt-out 제도 또는 동의 없이도 이용할 수 있는 추가적인 합법 처리 근거를 마련한다거나 이러한 것들을 도입할 필요가 있습니다. 그런 관점에서 현재 국회에 계류 중에 있는, 아마 조만간 통과될 것으로 보이는데 개인정보 보호법 개정안이 일정부분 기여할 것이라는 예상도 있었습니다.
그럼에도 불구하고 더 나아가서 법이 통과된다고 하더라도 좀 더 전향적으로 개인정보를 처리할 수 있는 데이터 샌드박스 제도라든가 또는 기타 합법처리 근거의 확대 논의가 앞으로 필요하다는 말씀들이 있었습니다.
그리고 또 한편으로는 그 반대적 측면에서 많은 데이터가 처리되다 보면 불가피하게 개인에 대한 보호, 개인정보 침해 문제라든가 특히 개인정보 자체에 대한 침해가 아니라 하더라도 개인에 대한 감시 문제가 생겨날 수 있다는 것이 자율주행차와 관련된 중요한 이슈로 제기되었습니다.
그래서 데이터 처리를 넘어서서 실제로 자율주행을 하는 과정에서 찍은 동적인 태양을 감시하는 것 자체도 문제이기 때문에 그러한 문제를 적절히 다루고 국민의 기본적 자유와 권리를 보장할 수 있는 방안도 함께 고민이 필요하다, 그렇기 때문에 적절한 안전조치 등을 함께 도입할 필요가 있다는 말씀들을 하셨습니다. 그리고 더 나아가서 이런 이동형 영상정보처리기기와 관련해서 많은 문제들이 제기될 수 있기 때문에 이에 대해서는 사회적 합의를 도출하기 위한 좀 더 깊이 있고 확대된 논의가 필요하다는 말씀들이 있으셨습니다.
이상으로 보고를 마치겠습니다.”]

의장 윤종수 : [“깔끔한 정리 고맙습니다. 그러면 오늘 제6차 미래포럼을 진행하는데 우리가 큰 제목으로는 ‘미래산업과 프라이버시의 조화’라는 제목으로 제4차부터 시작해서 제5차, 제6차를 했습니다. 그래서 4차에서는 메타버스, 생체정보 그다음에 제5차에서는 조금 전에 정리한 것과 같은 자율 이동체 산업 그런 내용으로 진행을 했습니다.
오늘 ‘미래산업과 프라이버시의 조화’ 마지막 포럼으로 ‘인공지능 및 로봇 산업과 개인정보’라는 제목으로 오늘 포럼이 진행되고, 발표는 아까 잠깐 소개해 드린 하정우 네이버 AI연구소 소장님께서 ‘초대규모 AI 생태계의 현재와 미래’라는 제목으로 아주 흥미진진한 발표를 해 주실 것입니다. 그리고 이어서 이상호 KT AI Robot 사업단장님께서 ‘서비스로봇 현황과 미래’라는 제목으로 발표해 주시겠습니다.
우리가 지난 미래포럼 진행했던 것과 달리 오늘부터 앞으로 그렇게 진행될 것 같은데 지정 토론자 없이 두 분의 발표가 끝나면 바로 전체 토론으로 넘어가겠습니다.
우리가 항상 시간에 쫓기다 보니까 참여하신 위원님들께서 토론에 참여하실 기회가 줄어드는 것 같아서 그렇게 진행하기로 했으니까 오늘은 마음껏 토론을 해 주시면 될 것 같습니다. 그래서 발표자 두 분께서는 각 한 20분씩 발표해 주시면 될 것 같습니다.
그러면 하정우 소장님께서 먼저 발표를 해 주시겠습니다.”]

네이버 AI 연구소장 하정우 : [“반갑습니다. 네이버 AI Lab의 하정우라고 합니다.
제 입장에서 봐서는 굉장히 무서운 곳에 와서 혼날 것 같은 느낌의 발표를 하게 될 것 같고, 최대한 혼나지 않도록 열심히 설명드리겠습니다.
요즘 AI가 굉장히 핫한 화두입니다. 전 세계의 많은 나라들, 특히 미국, 중국 중심으로 해서 ‘이것 없으면 미래도 없다’ 이런 느낌으로 많이 국가적으로도 드라이브를 걸고 있고 기업들도 드라이브를 걸고 있습니다.
특히 그 중심에는 초거대 AI 혹은 초대규모 AI가 있는 것 같습니다. 이 기술의 발전으로 굉장히 많은 것들이 심지어 AI 내에서도, AI 밖으로도 많은 변화가 일어나고 있는 것 같습니다. 그래서 그 부분에 대해서 설명을 드리려고 합니다.
초거대 AI의 핵심은 모델의 크기가 커지는 부분도 있지만 굉장히 많은 데이터를 활용해서 이루어진 부분들이 있는 것이고, 굉장히 많은 데이터라는 것들도 네이버도 마찬가지이고 다른 초거대 AI들도 마찬가지지만 사용자들에 의해서 만들어진 데이터들이 굉장히 많습니다. 그런 관점에서는 어떤 개인정보와 연관이 되는 부분들이 틀림없이 있습니다. 물론 지재권과 연관이 되는 부분들도 있을 것입니다. 이런 쪽 관련해서 여러 가지 의견을 주시면 좋을 것 같습니다.
초거대 AI 시대라고들 합니다. ‘초거대’라는 용어가 보편적으로 쓰이기 시작한 것은 결국 2020년 5월 말, 오픈AI가 GPT-3을 공개하고 나서부터라고 거의 인식되고 있습니다. 그리고 Foundation Model이라고 해서 스탠포드 대학에 있는 휴먼 센터드(Human-Centered) AI 그룹에서 처음으로 ‘Foundation Model’이라는 용어를 사용하게 된 것 같습니다.
여기서 정의하는 Foundation Model이라는 것은 과거에는 특정 문제를 풀기 위해서 AI를 만들 때 특정 각각의 문제를 위한 데이터를 만들어서 학습을 했던 데 비해서 이제는 데이터의 형태와 상관없이 어떤 형태의 텍스트든 이미지든 오디오든 상관없이 하나의 큰 기반이 되는 모델에 학습을 시키고 그 모델을 가져다가 실제로 풀고자 하는 모델의 adaptation을, 혹은 적용하는 형태로 많이 흘러가고 있다, 이것이 앞으로 AI의 방향일 것이라고 이야기하고 있습니다. 적어도 언어와 이미지 인식, 비전과 언어를 동시에 이해하는 모델 쪽은 거의 이쪽으로 흘러가고 있는 것 같습니다. 대표주자가 GPT 시리즈가 되겠지요.
이러한 Foundation Model이라는 용어가 2021년 8월에 처음 제안되었는데 올 9월에 나온 가트너 하이프 사이클(Gartner Hype Cycle)의 AI 버전에 따르면 출현 1년 만에 Peak of Inflated Expectation에 가장 꼭대기에 올라와 있습니다. 그만큼 비즈니스 관점에서도 엄청나게 각광을 받고 있다고 이해하고 있습니다.
이런 초거대 AI를 있게 만든 기술적인 발전들이 몇 가지 있었습니다. 그래서 2014년 정확하게 따지면 2010년까지로 거슬러 올라가는 것 같습니다. 특정 문제를 풀기 위한 AI를 바로 만드는 것이 아니라 공통으로 쓸 수 있는 모델을 만들고 그 모델을 가져다가 추가 학습을 하는 Pretraining & Finetuning이라는 이 메커니즘이 첫 출발인 것 같습니다. 그리고 Pretraining 모델을 굉장히 잘 만드는 것이 중요하기 때문에 이 Pretraining 모델을 더 잘 만들게 하기 위해 훨씬 더 많은 학습 데이터를 효과적으로 쓸 수 있는 방법인 자가지도 학습 방법의 발전 그리고 모델 구조에서는 인공신경망이 굉장히 역사가 오래됐지만 최근 2017년에 공개된 트랜스포머(Transformer)라는 이 모델구조가 또 완전히 새로운 혁신을 만들어내고 있는 것 같습니다.
그래서 빅데이터 시대에 굉장히 많이 공개되고 생산되고 있는 멀티모델 데이터와 합해서 시너지를 일으켜 초거대 AI가 성공적으로 세상을 바꿔나가고 있는 것 같습니다.
Pretraining & Finetuning 이야기는 기술적인 이야기니까 넘어가고, 실제 자가지도 학습이라는 것이 결국은 AI를 데이터를 가지고 학습을 할 때 기존 방법은 사람이 일일이 정답을 달아줬다면 이제는 AI나 학습을 하는 모델 자체가 정답을 스스로 정의하고 학습할 수 있기 때문에 우리가 확보할 수 있는 데이터를 모두 다 활용하여 AI를 학습시킬 수 있습니다. 이 덕분에 학습에 사용되는 데이터의 건수가 예전에는 100만장 이미지 학습하는 이 정도로 Pretraining을 했다면 요즘은 30억장, 50억장 이렇게 가지고 학습을 합니다.
이렇게 30억장, 50억장 데이터들은 사람이 실제로 가공한 데이터보다 노이즈가 있을 수도 있고 품질이 약간 나쁜 데이터들이 섞여 있을 수도 있음에도 불구하고 데이터를 충분히 많이 활용하면 정답 가지고 학습한 모델보다 정확도만 좋아질 뿐만 아니라 공정성, 편향성 그다음에 노이즈에 대한 강건함들이 훨씬 더 좋아진다는 것이 보고가 되어 있습니다.
트랜스포머(Transformer)를 말씀드리면 2017년에 구글번역기에서 처음으로 사용된 모델인데 지금은 저기에 있는 저 장표가 Lucas Beyer라고 해서 구글 브레인에 있는 시니어 연구자입니다. 트랜스포머 tutorial에 그려놓은 그림인데 보면 그림들이 6개가 있는데 똑같은 그림입니다. 트랜스포머 구조 그림인데 ‘사용되는 분야가 어디에 사용하든 상관없이 트랜스포머만 쓰시면 됩니다’ 이것을 한 장으로 요약해 놓은 것입니다.
실제 거의 대부분의 AI 적용 분야에서 트랜스포머라는 이 모델이 기존 Recurrent Neual Network, Convolution Neural Network, Multi-Layer Perceptron 다 압살하고 있다고 보시면 됩니다. 이렇게 해서 트랜스포머와 자가지도 학습, 수많은 데이터의 활용들로 초거대 AI 시대가 열렸고, 첫 스타트를 끊은 것은 GPT-3 2020년 5월 말 정도로 보면 한 1년쯤 있으니까 저것을 보고 전 세계 기업들이 충격을 많이 받았습니다.
그러면서 두 번째로 나온 것이 화웨이의 판구 알파(PanGu Alpha)입니다. 크기가 조금 더 크지요. 그리고 세 번째가 저희 네이버의 하이퍼클로바(HyperCLOVA)가 나오게 됩니다. 그 이후로 구글 딥마인드(Deepmind), 메타 그리고 MS MBD와 같이 이런 것들이 쭉 나오면서 전 세계가 이 초거대 AI를 만들고 확보하기 위한 경쟁을 하고 있습니다.
실제로 이 <표>는 State of AI Report라는 보고서에서 나온 것이고, 이 보고서가 작년부터 공개되기 시작했는데 기업에서 만든 것이 아니라 민간 연구자들이 정리한 보고서인데 1년 동안의 AI 이슈들을 정리하고 싶다, 이해하고 싶다, 구글 검색해서 저 보고서를 보시면 굉장히 깔끔하게 이해하실 수 있습니다.
또 다른 부분은 전 세계에서 GPT-3을 빼고 나면 굉장히 빠르게 실제로 만들고 공개하고 서비스까지 적용해서 생태계가 만들어져가고 있다는 측면에서 우리나라의 경쟁력이 초거대 AI 분야에서는 확실히 있는 편이라고 보시면 될 것 같습니다.
무엇보다 초거대 AI에 집중하는 이유는 이러한 부분 때문인 것 같습니다. 과거 AI가 AI 모델들이 할 수 없었던 In Context Fe-Shot Learning이라는 것 때문인데 이것이 어떤 형태냐 하면 학습을 함에 있어서 모델의 특성을 변화시키지 않고 저기에 있는 Prompt라는 저 부분만 입력으로 잘 주면 그냥 보기만 보여줬을 뿐인데 이 모델이 요약 모델이 되기도 하고, 번역기가 되기도 하고, 챗봇이 되기도 하고, 챗봇도 ‘이루다’처럼 말할 수도 있고 펭수처럼 말할 수도 있습니다.
여기에서 말하는 보기라는 것이 Prompt이고, Prompt는 제일 첫 번째에 있는 ‘너는 지금부터 펭수다’라는 지시어, 그다음에 그 밑에 있는 shot이라고 되어 있는 예시 몇 가지입니다. 저것을 어떻게 주느냐에 따라서 초거대 AI는 다양하게 변할 수 있고, 굉장히 많은 과업을 진행할 수 있습니다.
조금 다르게 말하면 저 Prompt를 잘 주면 아주 잘하고, 잘 못 주면 잘 못합니다. 사람에 따라 잘한다고 하시는 분들도 있고, 못 한다고 하시는 분들도 있고, 우리 검색 초창기에 검색엔진이 그렇게 똑똑하지 않을 때를 떠올려보시면 될 것 같습니다.
초거대 AI가 여러 가지 혁신적으로 잘하지만 첫 번째는 역시 글쓰기 능력인 것 같습니다. 실제 초거대 AI가 쓴 글은 사람이 구분을 하지 못한다는 것이 여러 실험으로 증명되어 있고, 여기서도 사람 보고 구분하라고 했더니 정확도가 50%가 나오더라라는 연구 결과입니다. 글을 쓰는 것 자체는 너무너무 잘 쓰고요. 우리나라에서도 뤼튼(Wrtn) 같은 스타트업이 카피라이트를 쓰거나 글을 쓰는 애플리케이션을 제공하고 있는데 써보신 분들은 다들 감동을 하시고요. 뒤에 설명드리겠지만 chatGPT(쳇지피티)도 마찬가지인 것 같습니다. 물론 여기서 말하는 글을 잘 쓴다는 것이 팩트를 보장한다는 의미는 아닙니다. 풀어야 되는 숙제고요. 문법적으로 굉장히 잘 쓴다는 것입니다.
현존 초거대 AI 단일 모델 중 가장 큰 것이 구글 PaLM이라고 하는데 이 모델은 Prompt로 5개의 예시만 보여주면 어지간한 언어를 이해하는 과제에서 사람 평균보다 잘한다, ‘평균적인 사람들보다 조금 더 잘하는 수준입니다’라는 연구결과가 보고가 되어 있습니다. 원래 언어 모델들은 수학적인 이해도가 떨어지지 않느냐라는 비판을 받아왔지만 수학 데이터로 파인튜닝을 하면 대수학, 기하학, 그다음에 확률, 미분, 통계 다 제법 많이 잘하더라라는 보고가 또 올라와 있습니다.
여기 계신 위원님들께서 요즘 워낙 chatGPT가 뜨겁다 보니까 써보신 분들도 계실 것이라고 생각합니다. 왼쪽에는 Self-supervised learning에 대해서 물어본 것인데 설명을 아주 잘하고, 오른쪽은 코드를 제가 짜달라고 했습니다. 저것을 한글로 적어도 되고 영어로 적어도 되는데 Image Net Long-Tailed 데이터를 로딩하는 코드를 짜달라고 하면 이제는 굉장히 정확하게 저렇게 짜줍니다. 어떤 형태의 대답도 굉장히 그럴듯하게 잘하고 그리고 지식도 아닌 이상은 굉장히 잘 답변해 줄 뿐만 아니라 코드까지 짜주는 세상이 된 것이지요. 초거대 AI로 제공이 가능한 기능입니다.
이렇게 똑똑한 초거대 AI에 버추얼 휴먼(virtual human)을 붙이면 또 다른 새로운 비즈니스 생태계가 만들어질 수 있겠지요. 지금 현재 버전의 virtual human들은 뇌가 없는 상태인데 이 뇌의 역할을 초거대 AI, 초거대 언어 모델 이런 것들이 해 줄 수 있을 것입니다.
그리고 또 하나 요즘 화두가 되는 것이 텍스트 정보를 줬을 때 그 문장이나 텍스트 표현을 이미지로 그려주는 AI가 굉장히 핫합니다. 오픈AI가 DALL-E를 API 형태로 공개했을 때도 사람들이 굉장히 많이 감동을 했었는데 이 Stability AI라는 스타트업에서는 학습한 모델을 통째로 공개해 버립니다. 그렇게 했더니 많은 사람들이 그 모델을 받아가서 자기네들이 쓸 만한 모델로도 파인튜닝을 하기도 하고 그다음에 이런 형태로 API 혹은 웹페이지 형태로 사용할 수 있게 하기도 하면서 이런 이미지 생성 관련된 새로운 생태계가 또 열리고 있습니다. 이것도 한번 써보시기를 권장드립니다. 한 번 써보시는 것이 백 마디 듣는 것보다 훨씬 나은 것 같습니다.
이런 초거대 AI를 저희가 지켜보게 된 부분은 바로 이 부분입니다. AI는 대부분의 회사가 고민하고 있는 것들이 특정 서비스를 위해 AI를 열심히 만들었는데 이렇게 만들어진 AI를 유사한 다른 서비스에 작용하면 잘 돌아가지 않습니다. 다시 만들어야 합니다. 이 이야기는 Scale-out 할 때 비용이 함께 증가한다는 부분이 pain point였습니다.
그런데 Foundation Model, 혹은 초거대 AI 모델의 특성 자체가 굉장히 빠르게 추가 학습 거의 없이 여러 가지 과제에 적용해 볼 수 있게 되기 때문에 개발하는 방법론 자체를 바꿀 수 있고, 초기 투자비용이 많이 들어감에도 불구하고 추가 적용의 비용이 굉장히 줄어들기 때문에 많은 회사들이 달라붙어서 활용하고 있다고 보시면 될 것 같고, 그 가능성을 저희는 2020년 8월부터 판단하고 한국에서 가장 먼저 투자해서 전 세계에서 3등으로 만들어낸 케이스입니다.
또 다른 하나는 이런 인프라류 기술은 초거대 AI도 그렇고 클라우드도 그러는데 인프라류 기술이라고 생각합니다. 기반 기술이지요. 기술패권과 직접적인 연관이 되는 부분입니다. 오픈AI가 실제로 그들의 GPT를 만들 때 영어 데이터를 93%나 썼지만 한국어 데이터를 0.016%밖에 쓰지 않았습니다. 이해도 못 하고 글도 못 쓰겠지요.
그래서 우리나라 사용자 관점에서 보면 이렇게 강력한 기능을 가진 파괴적인 AI를 제대로 활용할 수 없다는 문제가 있었고, 그리고 이 정도 기술이면 헤게모니(hegemony)를 바꿀 수 있는 기술이기 때문에 반드시 국내에 어떤 기업이든 진행해야 한다고 생각했습니다. 그래서 저희는 대한민국의 집단지성이라고 할 수 있는 네이버의 데이터 법적 이슈가 없는 상태로 최대한 끌어 모아서 오픈AI GPT-3 학습시킨 규모만큼의 데이터를 한국어 97%로 만들어서 학습을 시키게 되었습니다.
구글 클라우드가 학교에 메일 서비스를 제공했다가 갑자기 이렇게 정책을 바꿔버리고 앱 통행세 문제 이런 것들이 많지 않습니까? 이런 인프라 기술이 해외에 의존하게 될 때 생길 수 있는 여러 가지 이슈들, 엄청나게 많습니다. 저희는 그런 부분들도 고려했다고 보시면 됩니다.
그렇게 해서 만들어진 모델이 ‘논문 쓰고 모델 만들었어요’ 홍보하고 끝나는 것이 아니라 이미 네이버에 굉장히 많은 서비스에 적용되어 있고 검색, 쇼핑, 예약, 이미 사용자 그리고 저희 플랫폼에 있는 판매자분들이 도구로써 이미 굉장히 많이 활용하고 있습니다.
그리고 가장 대표적인 서비스가 이것인 것 같습니다. 저희가 2020년 초반부터 코로나 환자들 자가격리자를 대상으로 증상 확인을 위해서 공무원 대신 전화를 걸어드리는 서비스를 했었습니다. 그것을 HyperCLOVA를 활용해서 완전히 한 단계 업그레이드해서 혼자 사시는 독거노인 어르신 분들에게 전화를 걸어서 말벗을 해드리는 서비스를 전국 지자체와 함께 진행하고 있습니다. 한번 보시겠습니다.
(관련 동영상 상영)
전국 지자체 육천 분 이상의 어르신들이 이 서비스의 활용을 통해서 굉장히 삶의 질이 올라가고 계신데 저희가 최근에 업그레이드한 버전은 이분들이 지난번에 했던 통화를 기반으로 해서 이분들 각각을 기억하는 서비스들을 이번에 적용했습니다. 지난번 통화에서 허리 아프다고 했으면 ‘허리 아프시다는 것 이제 좀 어떠세요?’ 이런 식으로 대화를 하는 것이지요. 생각해 보면 이것 개인정보의 일환이기 때문에 이런 형태의 활용에 대해서 활용하게 할 것인가, 만약 정말 중요하다면 어떻게 활용하게 해 줄 것인가 이런 것들이 논의가 되면 좋겠습니다.
세상에 이런 초거대 AI가 프로그램이 사실 거의 필요가 없습니다. No Code 형태로 실현이 가능하다 보니까, 그리고 새로운 기회들이 굉장히 많이 열리고 있고 새로운 생태계가 열리다 보니 저희는 대학생들부터 컴퓨터 공학 전공자들 혹은 교양 수업에 이것을 코드 한 줄 없이 실습할 수 있도록 하는 것들을 과기정통부 예산을 지원받아서 제공하고 있고, 이번 가을 학기부터 시작했는데 수백 명 이상의 학생들이 실제 실습을 해 왔고 내년에도 예산 지원이 된다면 훨씬 더 많은 대학생들이 활용할 수 있도록 필요하면 초·중·고등학교도 지원할 수 있도록 준비를 하고 있습니다.
AI 윤리 워낙 중요하지요. 똑똑해지면 똑똑해질수록 윤리 문제가 더 대두되다 보니까 고학수 위원장님이 계시지만 저희 SSAFY와 함께 AI 윤리 준칙을 만들었고 그리고 내부적으로 AI 서비스를 만들기 위해서 설계 단계부터 지켜야 할 것들 내부 확인 프로세스도 운영하고 있습니다.
그리고 글로벌 관점에서도 저희가 HyperscaleFAccT라고 해서 컴퓨터공학 분야에서 최고 권위의 공정성학회에서 ‘초거대 AI의 공정성이란 어떠해야 하는가?’ 하는 워크숍도 개최했고, 이런 류의 워크숍은 아마 저희가 세계 최초로 열었던 것으로 알고 있습니다. 그래서 오픈AI, DeepMind, 구글의 Red Team이라고 하지요. 여러 팀들이 함께 참여해서 여러 가지 의견도 주고받은 것입니다. 그래서 글로벌 리더십을 갖고 있다고 말씀드리고 싶습니다.
생태계를 말씀드려야 하는데 저기에 나와 있는 모든 회사들은 초거대 AI를 가지고 있는 회사들인데 노란색으로 표시한 회사들은 API를 통해서 비즈니스 모델을 만들고 실제 운영하고 있는 기업들입니다. API 비즈니스가 있다는 이야기는 그것을 활용하는 고객들이 있다는 이야기이고 파트너가 있다는 이야기지요. 즉, 생태계가 만들어지고 있다는 뜻입니다.
오픈AI가 2020년 5월에 공개하고 나서 반년 만에 이 API를 활용한 애플리케이션 웹 혹은 모바일 앱이 300개 이상 등장했다고 합니다. 스타트업들이 그 API를 활용해서 그들의 아이디어를 가지고 새로운 비즈니스 모델을 만들고 있다는 뜻입니다.
그리고 텍스트를 이미지로 만드는 쪽은 이것이 더 혁신적인 변화가 일어나고 있는데 아래쪽에 있는 아카이브 논문, LDM이라는 논문이 작년 11월에 공개가 됐고, Stability Ai라는 스타트업에서 저 논문을 연구자들이 구현을 합니다. 그런데 구현하고 학습시킬 때 CompVis라는 그룹에서 LAION Five Billion이라는 데이터셋에 공개합니다. 50억 장짜리 만들어서 공개를 하고 저 데이터를 가지고 학습을 시켜놓고, GPU 부족한 부분은 일루더에이아이(EleutherAI)라는 그룹에서 GPU를 서포팅을 합니다. 그렇게 해서 만들어져서 모델 통째로 공개된 것이 스테이블 디퓨전(Stable Diffusion)이라는 모델입니다.
이것이 얼마나 각광을 받고 있냐면 오픈 소스에서 주목도, 인기도를 판단하는 가장 좋은 방법 중 하나가 Github stars인데 Bitcoin, Ethereum이 올라가는 그래프가 저 정도인데 Stable Diffusion이 가장 끝에 있지요. 거의 90도 각도로 올라오고 있습니다. 현재 오픈AI DALL-E 생태계를 완전히 파괴시켜버리고 새로운 생태계를 만들고 있습니다.
병원에서는 Stable Diffusion 모델을 가져다가 파인튜닝해서 병원에 더 추가적으로 필요한 데이터를 만들어서 진단하는 학습, 노블AI(Novel AI)라는 스타트업은 저런 캐릭터 애니메이션 데이터에 파인튜닝을 해서 저것으로 비즈니스 모델을 아예 만들고 있습니다. 새로운 생태가 만들어지는 것이지요.
저희도 올 2월부터 많은 스타트업들이 공짜로 활용할 수 있도록 저희 API를 열어드렸고, 뤼튼(Wrtn)이라는 스타트업은 카피라이트를 자동으로 생성하는 애플리케이션을 만들어서 이번 CES에서 혁신상을 받는다고 합니다.
그래서 큰 그림에서 보면 클라우드 기반의 초거대 AI를 제공하는 provider가 있고, 이 초거대 AI를 활용해서 아이디어만 있으면 어떤 새로운 구현 계획만 있으면 굉장히 많은 스타트업들이 활용해서 새로운 비즈니스 기회를 만들 수 있다고 생각하고 있습니다. 이 전체 시스템이 점점 더 발전해 나가는 그것이 초거대 AI 생태계라고 보고 있고, 이미 상당히 진행되고 있습니다.
언어 모델에 국한된 것이 아니라 개인의 검색 히스토리, 쇼핑 히스토리도 비슷한 형태로 초거대 모델로 학습하고 나면 굉장히 다양한 서비스에 저기에서 만들어진 유저의 특징들을 다양한 추천 서비스 혹은 마케팅 서비스를 활용하면 굉장히 성능이 좋아지는 것으로 저희 내부적으로도 확인하고 있습니다.
이렇게 새로운 세상이 열리고 있다 보니까 아무래도 새로운 질서가 필요한 것 같습니다. 이미 뉴스화가 돼서 잘 아실 AI 미드전이라고 하는 그림을 그려주는 AI인데 미드전으로 그림을 그려서 미술대회에 나갔는데 대상을 수상해 버립니다. 이것을 인정할 것이냐 말 것이냐 이런 이슈가 생기기 시작합니다. 이미지를 그려주는 Stable Diffusion 같은 모델을 가지고 그다음에 스토리도 랭기지 모델을 가지고 만들어서 웹툰을 그려냅니다. 미저작권청에서 이것을 작가라고 저작권을 인정해 줘버렸습니다. 그러면 과연 이런 형태의 작품에 대한 저작권을 어떻게 인정해 줄 것이며 여기에 사용된 학습 데이터에 대해서는 어떻게 가치를 인정해 줄 것이며 등등 논의할 것들이 엄청나게 많이 늘어나고 있는데 공감대가 아직까지 만들어지지 않고 있고 공감대를 만들어가야 되는 상황입니다.
정부 차원에서도 디지털플랫폼정부 이야기를 하면서 그 구현의 근간의 핵심은 데이터, AI, 특히 초거대 AI가 민간에서 만들어서 제공하는 이 기능을 정부의 공무원들이 일하는 방식을 혁신적으로 바꾸고 그다음에 대국민 서비스에서 챗봇 같은 서비스들을 포함해서 특허청에서 특허정보 요약을 하기 위한 여러 가지 것들, 이런 데서 혁신적인 서비스를 만들어내는 것들까지 포함해서 디지털플랫폼정부를 구현하는 데 활용하기 위해서 여러 가지 노력을 하고 있다는 관점입니다.
그래서 초반에 말씀드린 바와 같이 이것이 제대로 돌아가려면 굉장히 많은 데이터 그리고 그들이 융합되어야 이런 혁신적인 것들이 가능해지는데 개인정보 부분들이 틀림없이 있을 것 같습니다. 이런 부분들에 대한 논의 그리고 가급적이면 잘 활용해서 가치를 만들고 그 가치들이 데이터를 제공하는 많은 분들에게도 혜택이 될 수 있도록 하는 방향으로 가야 되지 않나 생각합니다. 감사합니다.”]

의장 윤종수 : [“세상이 이렇게 정리돼서 들으니까 더 엄청난 충격으로 더 다가오는 것 같습니다. 어떻게 어디에 어떤 영향을 미치고 우리가 준비해야 될 것이 무엇이고 개인정보도 개인정보 이슈지만 정말 다양한 주제가 많이 나올 것 같습니다. 좋은 정리, 좋은 발표 고맙습니다. 아마 후반전 토론에서 하실 이야기가 아주 많으실 것 같습니다.
다음은 이상호 사업단장님께서 ‘서비스로봇의 현황과 미래’라는 제목으로 발표를 해 주시겠습니다. 부탁드리겠습니다.”]

KT AI Robot 사업단장 이상호 : [“안녕하세요. KT 로봇사업단의 이상호라고 합니다. 우선 오늘은 ‘서비스로봇의 현황과 미래’라는 주제로 간략히 말씀드리도록 하겠습니다.
먼저 서비스로봇이라는 것이 사실은 갑자기 하늘에서 뚝 떨어진 것이 아니라 사실은 긴 역사를 가지고 시작되어 온 여러 가지 역사의 흐름 속에서 최근에 부각되고 있는 산업입니다.
산업용과 서비스로봇을 먼저 살펴보면 최근 한 10년 전부터 테슬라가 전기자동차를 만든 이후부터는 산업용로봇 시장 자체가 아주 흔히들 말하는 파괴적 혁신의 모델을 따라가고 있는 상황입니다. 그전에는 전통적인 자동차 산업과 같이 성장해 온 일반적인 B2B 전형적인 산업이라고 했다면 전기차가 나오면서부터 모든 밸루체인이 다 흐트러지고 있는 상황이고, 로봇 산업도 자동화 산업과 마찬가지로 그 물결에 휩쓸려가고 있는 부분입니다.
크게 산업용로봇과 서비스로봇의 트렌드를 보면 산업용로봇은 내연기관에서 사용되는 자동화로봇이 전부 다 전기차로 앞으로 10∼20년 안에 다 넘어가게 될 것 같습니다. 갑자기 왜 서비스로봇 이야기하는데 산업용로봇을 이야기하느냐? 전기차 생산라인으로 가면 로봇의 중심축이 우리가 흔히들 말하는 AGV 움직이는 모빌리티 개념으로 많이 들어갑니다. 예를 들어 현대 아산공장에서 그랜저가 1년에 10만대 생산되는 라인이 있다면 앞으로 전기차는 단일 모델이 대량 생산되는 것보다는 옛날 우리가 흔히들 생각했던 셀 생산 방식이나 다품종 소량생산과 같은 체계로 움직이기 때문에 컨베이어에 의한 생산 방식이 아닌 모빌리티 기반의 생산 방식으로 바뀌고 로봇자동화 또한 그렇게 바뀌게 될 것입니다.
그러다 보니까 그 모빌리티에 기반한 AGV/AMR이 확산되는 분야가 서비스로봇 분야로 자연스럽게 이어지게 되는 것입니다. 그것이 지금 현재 전기차 생산 라인의 자동화에서 촉발된 변화가 첫 번째로 적용된 것이 아마존의 키바(Kiva)라고 하는 2012년도에 물류에서 진행이 됐습니다. 물류에서 진행된 이 모빌리티 기반의 로봇자동화가 최근 한 3∼4년 전부터 우리의 일상생활로 들어오고 있는 기반 기술로 작용했다고 보시면 됩니다.
이렇게 보시면 로봇산업과 자동차산업은 저희가 흔히들 말하는 것을 ‘평행이론’이라고 하는데 포드가 1900년 초에 첫 번째 내연기관을 만든 것부터 자동차산업이 시작했다고 보면 로봇은 ’75년도에 시작됐습니다. 자동차 역사를 보면 우리가 흔히 말하는 디젤자동차 그다음에 가솔린자동차가 1997년도에 TOYOTA 하이브리드 자동차가 처음 나오고 2012년도에 전기차가 나오면서 한 100년 만에 엄청난 산업의 변화를 이끌고 있고, 로봇도 그대로 가고 있습니다. 75년도 처음 산업용로봇으로 시작된 것이 2008년도에 협동로봇이라는 개념이 처음 나왔고, 산업용로봇에서 협동로봇까지 가는데 무려 한 30년 이상이 걸린 것입니다. 협동로봇이 2008년도에 나왔는데 이제 모빌리티 기반의 서비스로봇 나오는 시점에 걸린 시간은 채 한 7∼8년밖에 걸리지 않습니다. 그러니까 자동차산업의 변화와 로봇산업의 변화는 저렇게 같이 가고 있다고 보여드리고 싶습니다.
결국 저 두 산업은 궁극적으로 1020년 안에 만나게 될 것입니다. 우리가 흔히들 지금 보고 계시는 서비스로봇이 1인 Mobility Personal vehicle로도 확장이 될 수도 있고, 이것이 일반 무인 배송으로도 확장이 될 수 있어서 두 산업 간의 융합은 앞으로 장기간에 걸쳐 우리 삶을 크게 흔들어 놓을 것이라고 생각하고 있습니다.
이 표는 과거 아까 말씀드렸던 2012년 테슬라가 자동차가 나오기 전에 로봇 산업과 그 이후의 로봇산업이 어떤지를 보여드리려고 하는데 보셨겠지만 2000년도∼2010년도까지는 저렇게 성장률이 CAGR이 한 2∼3%밖에 안 되는 산업이었다가 급속도로 로봇산업이 성장하게 된 몇 가지 터닝포인트가 있습니다. 금융위기를 계기로 전기차 시장으로 미국이나 선진국들이 준비하기 시작하고, 그러면서 테슬라가 본격적으로 시장에 출연하면서 판을 다 흔들어 놓고 있는 것이지요. 그 와중에 중국에서의 자동차 생산 비율이 급속히 높아지면서 자동화 비율은 넓어졌는데 그 이후 또 다른 변화가 기다리고 있다고 말씀드릴 수 있을 것 같습니다.
이렇게 보면 지난 한 40 몇 년 동안은 산업용로봇이 시장을 리딩했다고 말씀드릴 수 있습니다. 다만, 아까 말씀드린 것처럼 전기차나 아마존 Kiva의 사례로 촉발된 케이스로 인해 물류, 모빌리티에 기반한 전문 서비스용 로봇 시장이 최근 급속도로 성장하고 있고, 거의 CAGR로 보면 30%가 넘게 성장하고 있습니다. 그 이후로 보면 전문서비스 로봇 이외 차기 시장으로는 우리가 흔히들 이야기하는 집에서 쓰는 홈 로봇 개념으로 확장되리라고 예상하고 있습니다.
아마존에서 아스트로(astr)라는 로봇도 나오고, 이제 글로벌 기업들이 홈 시장에 진출하기 위해 사전에 시장을 태핑하거나 실증 사업을 여러 가지 추진하고 있는 트렌드를 보면 우리나라 기업 중에서도 삼성 같은 경우는 홈에서 쓰이는 로봇에 대한 초점을 맞추고 있는 것으로 예상할 수 있을 것 같습니다. 집에서 가전과 홈 또는 셋톱박스, AI 스피커, 국내 기업도 많은 시도를 했었는데 앞으로 한 10년 내에는 집에 하나씩 이동형 기반의 서비스로봇을 갖추는 형태로 산업이 진화하지 않을까 싶습니다.
최근 코로나 이후로 모두 다 아실 겁니다. 사실은 서비스로봇이 왜 갑자기 이렇게 내 주변에 많이 보이기 시작했느냐? 궁극적인 이유는 결국 인력 부족입니다. 이것은 비단 한국뿐만 아니라 미국, 유럽에서 다 공통적으로 벌어지고 있는 케이스입니다. 과거 코로나 전에 경험을 했던 인력 부족보다 지금은 더 심각한 수준으로 인력 부족이 진행되고 있습니다. 더군다나 한국 같은 경우에는 인구통계학상, 흔히들 말하는 MZ세대들의 비율이 점점 매우 가파른 속도로 하락하고 있습니다. 결국 우리가 흔히들 식당이나 호텔이나 알바생들의 시장 진입률 자체가 매우 큰 폭으로 떨어지고 있어서 이제는 로봇을 비롯한 자동화기기가 없으면 식당 창업을 할 수가 없을 상황까지 몰리고 있습니다.
잘 아시겠지만 지금 월급 300만원, 400만원을 준다고 해도 알바생들을 뽑지 못하는 것이 지금 식당 운영하시는 분들의 피드백입니다. 결국 키오스크, 그다음에 각 테이블마다 올려져 있는 테이블 주문 시스템, 로봇 등이 사실은 최근에 식당 창업을 준비하고 계시는 젊은 창업자들에게는 옛날에 우리 식당 창업할 때는 인터넷, TV 여러 가지가 필수조건이었던 것처럼 그런 항목들이 필수조건이 되어 가고 있습니다.
이렇게 보면 한국 시장은 최근에 어떻게 되어 가고 있냐면 식당에서 보시는 서빙 로봇 위주로 시장이 급속도로 커지고 있습니다만 불행하게도 한국에서의 서빙 로봇 시장은 중국 제조업체와 한국 유통업체가 3∼4년 전부터 사업을 시작한 계기로 인해서 시장점유율이 많이 떨어지고 있는 상황이기는 합니다.
실내로봇은 아직은 국내에서 시장이 열리고 있지는 않고 제한적인 범위 내에서 실증사업이 진행되고 있다고 하는 반면에 미국 시장에서는 제가 다음 슬라이드에서 말씀드리겠지만 매우 다양한 형태의 로봇이 아주 급속한 시장점유율을 늘려가고 있는 상황이라고 말씀드릴 수 있습니다. 그 외에 물류도 최근에 아마존뿐만 아니라 국내에서도 쿠팡을 위시로 해서 저런 라이더 기반의 자율주행로봇이 매우 확산되고 있음을 확인할 수 있습니다. 특히 옆에 오른쪽에 쿠팡 같은 경우 최근에 오픈한 대구 애플서비스센터에는 수백 대의 물류로봇이 적용되고 있는 것을 기사로 확인하실 수 있습니다.
작년에 저희가 올해 또는 내년에 서빙 로봇 시장이 몇 대가 예상된지 추정했던 적이 있었는데 작년에 ’25년도 시장을 3,000대로 봤습니다. 그런데 실제로 저희가 불과 한 6개월 만에 전망치를 수정해야 할 정도로 지금 저 수요는 급격히 늘어나고 있습니다.
글로벌 서비스로봇 시장을 잠깐 또 넘어가 보면 실내배송 시장이 역시나 제일 큰 시장입니다. 실내 서빙로봇보다는 해외에서는 아마존이나 월마트 그다음에 레스토랑에서 고객의 집까지 배달해 주는 배송로봇 시장이 급속도로 커지고 있습니다. 잘 아시겠지만 Starship 같은 업체들은 이미 시장을 꽤 많이 큰 폭으로 확대하고 있습니다. 나머지 업체들도 지금 제휴를 통해 FMB업체 또는 유통업체와 제휴를 통해 급속도로 시장을 키워나가고 있습니다.
’22년도에 불과 한 2억 달러 정도의 시장 규모가 ’27년도에 10억 달러로 예상하고 있어서, 미국 같은 시장에서도 왜 갑자기 이 실내로봇이 부각되느냐? 인력난, 배송비가 지나치게 비싼 부분들이 결국 핵심 이슈가 되고 있고, 자료에 나와 있는 것처럼 이런 로봇업체들이 최근 유통업체에게 제안하는 배송단가는 2∼3달러 정도입니다. 지금은 대부분 한 10∼15달러 기준에 의해서 사람이 배송해 주는 비용을 청구하고 있는데 저 부분을 획기적으로 낮춰서 결국 유통업체나 레스토랑 FMB업체들이 결국 경제적 이익을 얻는 것을 목표로 자동화를 추진하고 있습니다.
지금 크게 세 가지 로봇 형태로 나눠지고 있는데 인도 주행하는 로봇과 도로 주행하는 로봇으로 나오고 있습니다. 그런데 형태가 작은 로봇으로부터 큰 로봇까지 구분되어 있는데 당연히 도로 주행하는 로봇은 미국의 경우에는 도로 양 끝에 바이크레인이라고 해서 자동 자전거가 다닐 수 있는 구역이 따로 있는데 그 부분에 다니는 대형 로봇입니다.
미국 실외 배송로봇 시장에서 가장 특이한 점은 거의 모든 업체들이 Tele-operation을 기반으로 서비스를 시작했다는 점입니다. 즉, 완전자율 주행이 아니라 주행 초기에 맵을 학습시키기 위한 과정에서는 대부분 원격으로 로봇을 조종해서 출발지와 도착지까지의 각종 데이터들을 학습시키는 역할을 하고 있고, 중간중간 문제가 생길 때마다 Tele-operation이 직접 로봇을 컨트롤하고 제어하는 역할을 하고 있고, 지금 나와 있는 모든 3개의 업체들이 공통적으로 다 콜롬비아의 Tele-operation office를 전부 다 두고 거기에서 사업을 진행하고 있습니다. 아직은 완전자율주행 자체가 사업성이 없다고 대부분의 로봇업체들이 판단하고 있어서 약간의 하이브리드 형태로 자율주행과 Tele-operation을 기반으로 사업을 시작하고 있다고 말씀드릴 수 있습니다.
미국 업체에서 직접적으로 예상하는 사업 규모입니다. 지금 대략 한 2030년 정도 되면 결국 실외 배송로봇 산업의 전체 비중이 30Million Dollar, 그중에서도 인도로 나가는 로봇 같은 경우에는 한 절반 정도 되리라고 예상하고 있습니다.
마지막으로 물류 로봇을 보면 앞서 말씀드린 바와 같이 다양한 형태로 모빌리티 기반의 물류 로봇이 적용되고 있습니다. 물류로부터 전형적인 흔히들 우리가 말하는 AGV/AMR이 아니라 저렇게 기존에 실내 배송로봇, 서빙 로봇과 유사한 형태의 로봇도 아주 적은 비용으로 시장을 확대해 나간다고 볼 수 있습니다. 결국 지금 양쪽에 보이는 로봇 제조업체 간의 경쟁이 물류에서도 벌어질 것이라고 예상하고 있습니다.
그러면 아까 로봇 산업과 자동차 산업은 결국 평행이론으로 간다고 말씀드렸는데 그리고 10∼20년 내 궁극적으로는 이 두 산업은 융합될 것이다. 결국 어떤 형태로 융합될 것이냐, 각각의 지향점은 조금씩 다르지만 결국에는 포인트에서는 두 산업이 만나서 공통된 서비스를 제공하는 접점이 발생할 것이라고 말씀드렸는데 결국 자율주행차는 완전자율주행이냐 아니면 Semi-autonomous의 차이만 있을 뿐 결국 자율주행의 형태를 띠게 된다면 모빌리티 개념의 확장으로 넘어갈 것입니다.
우리가 코로나 이전에 공유자동차 콘셉트들이 많이 나온 것처럼 자동차는 모두 네트워크로 연결되고 모두 네트워크 기반의 여러 가지 다양한 개인화 서비스, 공유형 서비스가 나올 것이라고 보고 있습니다.
로봇은 산업용 로봇, 협동 로봇, 서비스 로봇 이런 과정을 거치면서 결국 궁극적으로 지향하는 것은 무엇이냐? 결국 서비스에 대한 automation, 자동화입니다. 자동화가 도달할 수 있는 수준의 레벨이 차이만 있을 뿐 그 레벨을 높이는 데는 결국 AI 기반의 소프트웨어 역량이 가미돼서 우리가 생각하는 지금의 수준보다 더 높은 자동화에 대한 서비스의 지향점을 가져가는 방향으로 로봇은 발전할 것입니다.
지금 당장 현재 서비스 로봇의큰 서비스 큰 축은 결국 두 가지입니다. Delivery와 Patrol 기능에 다 포커싱이 맞춰져 있습니다. 그것이 실외든 실내든, 그것이 단거리든 장거리든 모두 저 두 가지 서비스에 초점이 맞춰질 것이고 저 두 가지 서비스에 특화된 AI 기반의 여러 가지 융합 서비스, 소프트웨어 역량들이 합쳐져서 결국에는 아주 높은 수준의 자동화로 갈 것이다, 흥미롭게도 공유형 커넥티드는 전기자동차나 자율주행차와 동일하게 로봇에서도 적용될 것입니다.
무슨 말이냐 하면 앞으로는 이런 대형 건물에 내가 배송할 일이 생기면 카카오T 택시로 호출하는 것처럼 스마트폰에서 앱 꺼내서 주변에 배송할 수 있는 로봇 리스트가 뜨고, 로봇 리스트를 클릭하고 주문정보만 전송이 되면 그 로봇은 10층에 있는 누구누구에게 직접적으로 배송해 주는 자동화 서비스, 공유형 형태의 로봇 배송 서비스가 아주 일반화될 것이라고 생각하고 있고 그에 따른 여러 가지 사업 기획이나 계획도 준비하고 있습니다. 이상입니다. 감사합니다.”]

의장 윤종수 : [“이상호 단장님께서 ‘서비스로봇 현황과 미래’라는 제목으로 발표를 해 주셨습니다. 이렇게 두 분의 발표를 들으니까 초거대, 초대규모 AI 생태계라는 큰 흐름을 받고 거기에서 실제 응용되는 서비스 로봇이라는 부문에 대한 현황과 미래를 봤습니다. 아주 흥미진진하고 또 많은 생각하게 되는 발표였는데 두 분께 다시 한번 감사드립니다.
50분부터 4시까지 10분 동안 휴식을 하고 기념촬영한 후 전체 토론을 진행하도록 하겠습니다.”]

의장 윤종수 : [“이제 시작하겠습니다. 시작할 때 말씀드린 대로 지정토론 없이 바로 전체 토론을 진행하도록 하겠습니다.
당연히 예상되지만 여러 가지 이슈도 많고 관심 있는 부분도 많고, 또 하실 말씀이 많으신 것 같은데 이것이 여러 측면에서 고민되는 주제들이어서 논의하다 보면 커질 수도 있는데 저희가 개인정보 보호위원회의 미래포럼인 만큼 포인트는 개인정보 쪽에 집중되는 토론을 진행했으면 좋겠습니다.
먼저 온라인에서 윤영미 위원님께서 질의하셨다고 해서 한번 먼저 들어보도록 하겠습니다.

말씀을 하시기 어려운 상황이라고 하셔서 현장에서 대신 내용을 전달해드리겠습니다.
하정우 소장님께 질의해 주셨습니다. 하정훈 소장님의 발제에서 30억장에서 40억장의 빅데이터를 통해 정확성과 공정성이 커진다고 하셨는데 얼마 전 그림 AI 프로그램에서 강에서 헤엄치는 연어를 검색했을 때 강물에 덩어리 연어회 이미지를 보여주는 것이 화제가 됐는데 이후 많은 사람이 그림 인공지능의 연어 이미지 데이터와 명령을 학습시켜 며칠 걸려 겨우 제대로 된 연어 이미지로 보정됐다고 합니다.
이런 비슷한 일이 일어날 가능성이 있어보이는데 인간이 인공지능을 통제하기보다 설득하고 읍소해야 겨우 바른 결과치가 나오게 되는 문제가 해결될까요라고 질의해 주셨습니다.”]

의장 윤종수 : [“고맙습니다. 이것은 온라인에서 따로 물어보셔서 답변을 먼저 가볍게 해 주시고 그다음 진행을 하도록 하겠습니다.”]

네이버 AI 연구소장 하정우 : [“일단 기술적으로 보면 2개로 분리해야 할 것 같습니다. 제가 데이터를 많이 썼을 때 편향성, 공정성이 개선된다고 하는 부분은 인식하는 부분, 모델이 주어졌을 때 모델이 있고 데이터가 주어졌을 때 그 데이터 혹은 사진 안에 어떤 물체가 있는지, 이 물체의 특성이 무엇인지를 인식하는 관점에서는 명확하게 적은 수의 사람이 정답을 단 데이터를 가지고 학습하는 것보다 훨씬 더 좋아진다는 의미로 말씀을 드린 것입니다. 생성은 조금 더 인식하는 것보다 어렵습니다.
실제로 생성이라는 것은 데이터를 완전히 새롭게 만들어내는 것이고 데이터를 만들어낸다는 것은 세상 삼라만상의 데이터에 녹아 있는 굉장히 많은 의미들을 다시 사람이 알아볼 수 있는 형태로 만들어야 되는 것이다 보니까 굉장히 많은 조합의 것들이 모두 다 데이터로 포함돼서 들어가야 되는데 개별개별 굉장히 많은 패턴들이 있을 것이고 상대적으로 적은 패턴들이 있을 것입니다.
그래서 실제 이 그림을 그릴 때 봤더니 정말 안 되는 것이 말을 타고 있는 우주인은 정말 잘 그려지는데 우주인을 타고 있는 말은 절대 그려지지 않습니다. 왜냐하면 데이터에서 그런 패턴을 본 적이 없기 때문입니다. 그래서 창의성이 없는 것이 아니냐는 것도 대표적인 케이스이고, 연어도 동일한 케이스입니다. 실제 학습했던 데이터들 중에 물고기 연어는 별로 없고 이렇게 크롤해서 이미지를 만들었겠지요. 데이터를 만들었더니 다 먹는 연어들 중심으로만 되어 있다 보니까 그것을 텍스트로 입력했을 때 생성해내면 다 이렇게 연어 고기들만 만들어지고 있는 것 같습니다.
이런 개별개별 개념 물체들의 릴레이션 조합을 생각하면 몇 십억 장 데이터가 절대 많은 것이 아니고, 거의 수백억, 수천억으로 가야 그런 패턴들이 다 반영될 텐데 그렇게 가는 것은 현실적으로 쉽지 않습니다. 그래서 파인튜닝이라는 개념이 필요한 것이 그런 것 같습니다. 굉장히 많은 데이터로 초벌 모델을 만들고 와서 내가 써야 하는 분야에서 좀 더 정확하고 좀 더 의미 있는 데이터를 만들 수 있도록 본인이 구축한 데이터로 아까 의료데이터 보여드렸듯이 그런 쪽으로 추가 학습을 통해서 문제를 풀 수 있도록 하는 형태의 AI를 만들어가는 것, 이런 관점에서 보면 오히려 글로벌 테크기업에서 만든 혹은 큰 그룹에서 만든 모델들을 들고 와서 개별개별 스타트업이 됐든 다른 연구그룹들이 됐든 새로운 밸류를 또 만들 수 있는 방법이 있다는 측면에서는 또 나름의 의미가 있고 밸류를 만들 수 있는 기회가 있다고 이해하고 있습니다.

의장 윤종수 : [”고맙습니다. 결국 이것도 데이터의 편향성와도 관련되는 부분인데 아무리 많은 데이터가 처리가 돼도 결국 어떤 의미로든 편향성 문제가 생기는 부분이고, 그것이 오히려 새로운 비즈니스 모델의 기회도 될 수 있다는 말씀도 덧붙여주셨습니다.
자유롭게 토론해 주시면 될 것 같습니다. 오병일 위원님.”]

위원 오병일 : [“몇 가지 질문이 있습니다. 방금도 이야기했던 온라인상의 이미지를 학습해서 사용했던 인공지능 같은 경우 논란의 지점들이 되게 여러 가지 있더라고요. 그중의 하나가 어떤 아티스트 같은 경우 나는 전혀 몰랐는데 나의 그림체를 이용해서 인공지능이 학습한 결과물을 내놓더라, 또 이 과정에서 인터넷에서 인공지능과 무관하게 여러 작가들의 작품을 불법 복제해서 또 거기에 태그도 붙이고 활용되는 데이터베이스들이 있지 않습니까? 이런 것들이 또 인공지능 학습용으로 사용되는 것입니다. 그러니까 여러 가지 문제들이 중첩되어 있기는 한데, 어쨌든 여기서 인공지능이 인터넷상의 여러 데이터들을 학습할 때 여기서는 일종의 저작권 침해 데이터베이스를 학습한 것입니다. 불법물을 학습한 것이고, 예를 들면 또 다른 디지털 성폭력물을 학습했다든가 이런 여러 가지 인터넷상에 불법물을 학습할 수도 있을 텐데, 정제되지 않은 인터넷에 있는 콘텐츠들을 이렇게 스크래핑해서 학습할 때 이런 불법성의 문제를 체크하는 절차가 있는지 궁금합니다.
또 하나는 아까 발표하실 때 이런 초대규모 인공지능 같은 경우 그 데이터의 편향성이 오히려 정제된 데이터보다 더 공정성이라든가 여러 가지 측면에서 더 낮다는 연구결과도 있다고 하셨는데, 그런 공정성 관리 같은 것은 어떻게 보고 계신 것인지, 지금 인공지능 편향 문제를 이야기하면서 알고리즘의 문제도 있겠지만 그런 데이터의 공정성, 데이터를 어떻게 정제할 것인가 이런 고민들이 있는데 초거대 인공지능 같은 경우 아예 그 자체가 불가능할 것 같습니다. 그러면 다른 방식으로 해결하는 또 다른 고민이 있는 것인지 아니면 그 자체로 공정하다고 간주해버리는 것인지 그런 부분들이 궁금합니다.
그다음에 또 하나의 질문은 클로버 케어콜 서비스 같은 경우 실제 서비스가 이루어지잖아요. 그러면 실제 서비스 과정에서 또 인공지능 학습이 되는 것인지, 혹은 서비스 과정에서 어쨌든 반응하는 대상자들, 사람들의 데이터들이 수집될 수가 있는데 그런 데이터 처리는 어떻게 되는지, 예를 들면 클로바 서비스가 있고 또 그런 것들을 사용하는 지자체라든가 사용자가 또 있을 수 있고, 실제 서비스를 이용하는 사람들이 있을 수 있고 여러 주체들이 있을 수 있잖아요. 그 과정에서 데이터 처리를 어떻게 하고 있는지 그런 부분이 궁금합니다.
마지막 질문으로는 네이버 아까 윤리원칙에서 합리적 설명이라고 하셨는데 초거대 인공지능도 그렇고 그보다 못한 인공지능 같은 경우도 이런 인공지능의 추적 가능성이나 설명 가능성이 힘들다고 많이들 이야기하지 않습니까? 그러면 여기서 이야기하는 합리적인 설명은 어떤 방식으로, 아니면 어떤 정도 수준에서의 설명을 상정하고 계시는 것인지 그런 부분들이 궁금합니다.”]

네이버 AI 연구소장 하정우 : [“답변드리겠습니다.
첫 번째 질문이 개인 작가들의 그림책 혹은 저작권 관련해서 학습에 활용되는 것들이 경우에 따라서는 침해가 될 수도 있고, 불법물이 학습에 활용될 수도 있다고 말씀을 주셨습니다.
이것도 인식 모델과 생성 모델을 구분할 필요가 있을 것 같습니다. 인식 모델 같은 경우는 상대적으로 조금 자유로운 편이긴 합니다. 그 결과물이 생성되는 새로운 형태의 콘텐츠로 만들어지는 것이 아니라 이런 물체가 있다 없다, 혹은 데이터 안에 이런 물체가 어디에 있다, 약간 이런 형태로 흘러가는 것이다 보니까 실제로 지재권 자체를 침해하는 형태로 흘러가지 않다 보니 오히려 미국 대법원에서도 생성 모델이 아니라 분류하는 모델 혹은 검색에 직접 적용되는 가공된 형태의 축약된 정보로 뱉어내는 것은 지재권이 있는 데이터라고 해도 활용해서 그것이 새로운 밸류를 만들 수 있으면 괜찮다까지는 했는데, 문제가 되는 것은 생성되는 새로운 콘텐츠가 만들어지는 것이고 이 콘텐츠가 학습데이터의 정보나 스타일을 그대로 가져와서 만들어지는 부분이다 보니까 문제가 되는 것 같습니다.
Stable Diffusion 제가 말씀드렸지만 최근 버전 2.0이 나왔습니다. 2.0으로 간 것은 기술적으로 뭐가 바뀐 것이 아니라 1.0 때 많은 문제가 됐던 것 중의 하나가 성적인 데이터를 포함해서 굉장히 문제가 되는 데이터들까지 같이 학습을 했던 것으로 판명이 나고 있습니다. 왜냐하면 만들어 보니까 그런 이미지들이 만들어지더라는 것이지요. 그래서 굉장히 많은 비판을 받고 나서 문제가 될 만한 데이터들을 최대한 많이 배제시켰다고 합니다. 그렇게 돼서 오히려 퀄리티는 떨어지는데 문제가 될 수 있는 부분들은 훨씬 더 덜해졌다는 이야기가 있습니다.
말씀하신 대로 이 부분은 AI를 개발하는 쪽에서 학습 데이터를 정제할 때 당연히 기술적으로는 감안해야 하는 부분이고, 네이버 같은 경우 이미 전담조직이 있기도 합니다. 이런 부분들을 챙기고 있는데 아마 스타트업이었으니까 양도 너무 많고 그렇게 하기 쉽지 않았었던 것 같습니다.
그러면 이런 저작권 관련된 데이터들의 학습에, 생성 모델을 위한 학습에 쓰게 할 것이냐 말 것이냐는 법적으로 정리된 부분이 사실상 없고, 제가 알기로 그레이 영역이어서 이 부분을 우리나라에서는 상당히 네거티브하게 보고 있습니다. 문제가 되면 안 된다, 그래서 똑같이 나오면 안 된다 이렇게 걸고 있고, 반대로 미국은 일단 질러라, 공개한다, 그러고 나서 문제가 생기면 그때 법리적으로 다툰다, 약간 이렇게 전혀 다른 철학을 가지고 있습니다.
저희 입장에서는 회사니까 미국 스타일로 ‘일단 내놓고 문제가 있으면 어떠어떠한 문제들에 대해서 그렇다면 이런 문제들을 풀기 위해서 이렇게 합시다’ 이런 식으로 논의가 진행되면 좋겠다는 생각이 기본이고, 아예 이럴 것 같으니 모두 하지 말자고 하면 미국, 중국, 다른 나라들 저렇게 달리고 있는데 우리는 시도 자체를 못 하게 되니까 trial and error를 했으면 좋겠다, 그러면서 같이 어떤 솔루션을 만들어 갔으면 좋겠다는 바람이 있습니다.
두 번째는 공정성 관리를 위해 자체적으로 평가하는 벤치마크를 내부적으로 만들어놓고, 그 벤치마크 기준으로 평가를 합니다. 아까 보여드렸던 페이스북에서 나온 Self-Supervised로 공정성이 더 좋아졌다, 편향성이 더 좋아졌다는 것도 내부로 평가할 수 있는 평가 데이터셋을 만들어놓고 기존 모델 대비 얼마나 좋아지더라 이런 식으로 하고요. 논문이 나왔다는 것 자체는 정확하게 나름의 평가 프로토콜이 있다고 보시면 되는데 문제는 학계에서 바라보는 평가 프로토콜이 사회과학 관점에서 바라봤을 때 생각하는 평가 프로토콜과 그것을 만족할지 아닐지에 대해서는 또 논의가 필요한 것 같습니다. 그래서 이런 부분들은 좀 더 많이 같이 논의를 해야 될 것이라고 생각합니다. 통계적으로는 나름 의미 있게 평가하고 있다는 정도로 이해해 주시면 될 것 같습니다.
케어콜 서비스 같은 경우 제가 ‘기억하기’를 말씀드렸는데 기억하기 같은 경우도 말씀하셨던 것들을 학습해서 추가 모델에 적용해서 진행하고 있습니다.
제가 정확하게 기억이 안 나는데 ‘수집·학습에 활용할 수 있습니다’를 수집 동의를 받았는지 안 받았는지 내부에 들어가서 체크해 봐야 될 것 같습니다. 중요한 부분은 상당히 대부분은 초거대 AI 모델을 가지고 데이터를 만들어낸 것으로 다시 파인튜닝을 한다고 보시면 될 것 같습니다. 아무래도 개인정보 이슈 등이 있다 보니까 그런 부분들은 굉장히 많이 신경을 써서 하고 있습니다.
다행스러운 것은 이 초거대 AI가 이런 대화도 보셨다시피 굉장히 잘 만들어냅니다. 어르신들과 대화를 어떻게 해야 하는지, seed 몇 개를 설계해 놓으면 설계된 데이터에 굉장히 잘 맞게 데이터도 많이 만들어지고 그 데이터로 나름 조금 더 어르신들의 만족도를 높게끔 학습시키는 방법들도 논문으로 발표한 것이 있는데 어쨌든 정교하게 학습을 시키는 부분이 있습니다. 그런 형태로 진행하고 있다고 보시면 될 것 같습니다.
마지막으로 합리적 설명 가이드라인은 앞서 말씀드린 부분은 ‘이렇게이렇게 해 나가겠습니다’의 방향성 관점에서 봐주시면 될 것 같습니다. 기술 관점에서는 저희가 굉장히 많이 노력하는데 Neural net이라는 것이 아무래도 성능 중심으로 가다 보니 Neural net의 특성 자체가 사람이 봤을 때 이해를 정말 잘하도록 결과물을 뱉어내는 노력이 굉장히 많이 필요합니다. 블랙박스냐라고 물으면 블랙박스는 아닌 수준이라는 여러 가지 연구 결과가 나오고 있고, 또 실제로 많은 연구자들이 크고 복잡한 모델에서 어떻게든 어떤 인과관계를 통해 이루어지는지를 시각화하거나 설명하게 하는 연구들이 굉장히 많이 진행되고 있어서, 저희 입장에서는 그렇게 진행되고 있는 최신의 연구 결과, 혹은 가장 좋은 설명하는 방법들을 최대한 써서 노력을 하겠습니다, 이런 관점에서 봐주시면 될 것 같습니다.
저희 AI랩에서도 그 부분을 좀 더 잘할 수 있도록 하는 것들 KAIST, 서울대와 같이 연구를 진행하고 있다, 정말 최선을 다해서 이런 기능들을 제공하겠다, 이런 관점에서 이해해 주시면 될 것 같습니다.”]

의장 윤종수 : [“자세한 답변 고맙습니다.”]

위원 김이식 : [“질문은 아니고, 개인적으로 저희 사업에서 인공지능을 써보고 있는 중인데 거기서 느낀 몇 가지 시사점이 있어서 같이 공유하고 싶습니다.
지금 저번부터 AI 할 때마다 나오는 이슈가 ‘이루다’ 이슈부터 시작해서 편향성 이야기가 거의 빠지지 않고 나오는데 편향성이라는 문제를 조금 다른 시각으로 한번 보면 어떨까 해서 두 가지만 설명드리고 싶습니다.
첫 번째 주장은 편향성은 어떤 면에서 보면 사업의 기회일 수가 있다, 스타트업이라든지 새로운 많은 비즈니스가 생겨날 수 있는 기회일 수 있다고 생각합니다. 저희가 인공지능으로 그림을 그려보고 있는데 지금 나와 있는 DALL-E에서 무엇을 잘 못 그리느냐면 사람의 손가락을 잘 못 그립니다. 손가락이 5개가 아니고, 특별히 손가락만 잘 못 그립니다. 왜 그런지 잘 모르겠는데, 그러면 문제가 있지요. ‘이루다’ 건과 비슷하게 그 부분이 문제가 있는 것이지 않습니까?
그렇다면 저희는 어떤 일을 하려고 하느냐 하면 손가락을 잘 그리는 AI를 찾으려고 온갖 노력을 하고 거기에 돈을 지불할 의향이 있습니다. 이렇게 편향성이라고 불렸던 뭔가 문제가 있을 때 그것은 사업의 기회가 될 수 있을 것 같습니다.
어떤 예를 들어볼 수 있냐면 방송에서 개그맨이라든지 아니면 진행하는 사람들, 신동엽 같은 사람들은 굉장히 야한 농담을 잘하지요. 그다음에 아나운서 같은 사람들은 굉장히 정중한 표현을 잘하지 않습니까? 어떤 AI는 굉장히 정중한 표현을 좋아할 것이고 어떤 사람은 굉장히 경계선을 왔다 갔다 하는 농담을 잘할 수도 있는데 각각 다 캐릭터가 있고 효과가 있지 않습니까? 편향성이라는 문제가 어떤 사람은 아나운서처럼 정말 정중하게 말하는 AI로 성공할 수 있고, 어떤 사람은 굉장히 재미있게 이야기하는 사람이 있겠고, 어떤 사람이 너무 과하게 이야기한다면 그 사람은 연예계에서 퇴출이 되겠지요. 그렇게 편향성 문제는 해결되고, 어쩌면 그런 것들이 다양한 사업의 기회를 창출하지 않을까 하는 생각을 한번 해볼 수 있을 것입니다.
오늘도 이야기가 나왔던 것이 해외가 영어로 다 학습을 시키다 보니까 네이버가 한국어로 학습시킨 것이 기회가 되잖아요. 똑같이 그림 이야기를 한번 더 드리면 서양인으로 그리면 그림이 굉장히 예쁘게 나옵니다. 그래서 ‘서양인 말고 이것 동양인으로 바꿔줘?’ 갑자기 수준이 거의 초등학생 그림으로 확 바뀌어버립니다. 지금은 굉장히 안타깝지만 누군가는 동양인을 잘 학습시킨 어떤 AI는 여기에서 그것 때문에 사업의 기회가 될 수 있을 것 같아서 편향성이라는 문제를 사업의 기회로 생각해 봤으면 좋겠다는 것이 하나입니다.
두 번째로 공유하고 싶은 이야기는 저희가 하면서 깨달은 것인데 다른 데도 다 공감할 것 같습니다. 인공지능에게 그림을 그리라고 설명하는데 어떤 그림은 굉장히 잘 그려주고 어떤 그림은 너무너무 못 그립니다. 그래서 왜 그런지 가만히 봤더니 contextual한 배경지식이 필요한 그림들을 잘 못 그립니다.
어떤 사람이 돈을 잃어서 슬퍼하는 그림을 그리라고 하면 잘 못 그립니다. 그런데 아주 구체적으로 ‘말을 탄 우주인’ 이런 것은 아주 잘 그립니다. 그런데 뭔가 contextual한 것들이 있는 것들은 잘 못 그립니다. 그러니까 ‘인공지능 이런 후진 놈들’ 이렇게 생각했는데 저희가 그것을 작업을 하면서 깨달은 것이 뭐냐 하면 저희가 여태까지 디자이너들에게 일을 시켰던 것을 썼습니다. 그런데 디자이너들에게 일을 시킬 때 디자이너가 어떤 것은 아주 잘해 오는데 어떤 것은 잘 못 하는 것이 있었습니다. 우리는 그동안 디자이너가 뭔가 못해 오면 ‘저 후진 디자이너 내 말을 못 알아듣고 저렇게 못 해왔다’고 디자이너를 탓했는데 가만히 생각해 보니까 그것이 contextual한 것들이었습니다. 배경지식이 필요한 것들이었습니다.
이런 느낌은 어디서 봤냐 하면 아까 잠깐 이야기를 나눴는데 상사가 돼서 부하 직원에게 뭔가 일을 시킬 때 ‘이 바보 같은 놈아. 내가 해오라는 것은 그것이 아니고’라고 못 알아듣는다고 부하 직원을 많이 탓했었는데 가만히 생각해 보면 상사로서 그 업계지식에 너무 당연하다고 생각했던 배경지식이 필요한 것을 구분하지 못한 채 나는 그것이 너무 당연하다고 생각한 나머지 상대는 못 알아듣는 이야기들을 계속 해왔었던 것과 똑같은 맥락이더라고요.
그런데 사람과 했을 때는 못 깨달았던 것을 왜 기계와 하면서 깨달았느냐? 사람은 못 하면 ‘쟤가 못된 놈’이라고 생각했었는데 기계가 못 하니까 우리가 뭔가 잘못한 것이지 않습니까? 무엇을 잘못했는지를 깨닫게 되고, 뭐가 배경지식이 필요한 것인지를 알게 되더라고요. 우리는 너무 당연하다고 생각했지만 이것이 진짜로 배경지식이 필요한 것이었구나, 업계의 지식이 우리끼리는 너무 당연하다고 생각하는 것이었지만 한 발만 떨어져도 못 알아듣는 것이었구나라는 것을 기계니까 더 명확하게 인식이 되더라고요.
여기에서 이 문제는 어떻게 해결할 것이냐? 이것 역시 하이브리드의 기회가 있을 것이라는 이야기입니다. 어차피 편향성의 문제는 아까 손 제대로 못 그리는 것, 한국말 못 알아듣는 것 그것을 개선한다고 하더라도 끝없이 문제가 될 것입니다. 왜냐하면 배경지식이라는 것이 분야별로 계속 다르기 때문에, 편향성의 문제는 세월이 간다고 해결될 문제가 아닐 것이라는 것입니다.
어떤 특정 분야에서 예를 들면 고학수 위원장님이 계시는데 법학과 관련해서 법학자들은 너무 당연히 알고 있는 것들을 저희 같이 기술 쪽에 있는 사람들은 전혀 못 알아들을 수 있습니다. 그런 문제들이 있기 때문에 누군가는 중간에서 그것을 기획해 주고 번역해 주는 그런 하이브리드한 것들이 기회가 될 수 있을 것이고, 편향성의 문제는 이와 같은 이유로 끝없이 해결이 되지 않을 것이라고 생각합니다.
그래서 ‘이루다’ 이야기가 항상 AI 할 때마다 나와서 이것을 조금 전향적으로 생각해 보면 어떨까? 편향성이라는 것들이 기회일 수가 있겠다고 생각해 보면 어떨까 하는 이야기를 드리고 싶습니다.”]

의장 윤종수 : [”고맙습니다. 편향성에 대한 또 사업을 하는 입장에서 다른 측면에서 말씀해 주셨습니다. 최경진 위원님.”]

위원 최성진 : [“발표 아주 잘 들었습니다. 저는 구체적인 질문 하나 드리고 싶은데 AI 관련된 개인정보 이슈는 우리가 그동안 굉장히 많이 다뤘었고, 또 아마도 다양한 문제들이 있다는 것을 아실 텐데 저는 두 번째 발표를 들으면서 계속 궁금했던 것 중 하나가 어떤 것이냐 하면 추상적으로 손에 잡히지 않는 무체적인 형태로 존재하는 AI를 기반으로 한 다양한 법적 이슈는 우리가 논의를 많이 했는데 뭔가 물리적인 로봇과 결합됨으로 인해서 개인정보 이슈가 증폭되거나 아니면 새롭게 나타나는 것이 무엇이 있을까라는 것이 항상 고민이 됩니다.
그래서 로봇이라는 것을 개인정보와 결합해서 다룰 때와 그 전 단계에서 AI 자체, 거의 AI가 탑재돼서 같이 할 수 있으니까 그때의 이슈와 물론 똑같은 것도 있겠지만 로봇으로 인해서 좀 더 현실화되거나 또는 심화되는 이슈가 어떤 것이 있을까라는 생각이 하나가 들었고, 그것이 제 질문입니다.
그것과 관련해서 또 하나 혼자 좀 더 구체적인 이슈를 생각해 봤는데 제가 가끔 가는 피자집이 있는데 어르신 두 분이 운영하는데 여기에 로봇이 있습니다. 테이블에는 주문용 태블릿이 있습니다. 그런데 주문은 따로 하고 로봇이 오는데 저는 갈 때마다 느끼는 것이 ‘얘가 참 정이 없다’, 로봇이 제가 가면 알아서 ‘왔냐, 또 왔냐?’ 하면서 ‘지난번에 주문했던 것과 같은 것으로 주문해 줄까?’ 하면 저 성격 급하기 때문에 테이블에 앉기 전에 주문까지 끝나면 아주 좋겠는데라고 생각했는데, 맞춤형 서비스가 되는 것이지 않습니까? 그러려면 뭔가 저에 대한 데이터를 가지고 있어야 하고, 그것이 만약 KT 로봇이라면 뒤에 KT 클라우드를 이용해서 데이터를 그쪽에 저장할 수도 있고, 아니면 독립 형태로 피자집에 저장할 수 있는데 그랬을 때 저는 피자 주문하는 과정에서 계약 이행 정도로 해서 개인정보 이슈가 없을 수도 있겠다 싶은 생각이 들면서도 다른 한편으로는 그 자체가 굉장히 민감하게 받아들일 수도 있겠구나라는 생각이 들었습니다.
하여튼 질문드리고 싶은 것은 이것이 맥락에 따라 다를 수 있겠지만 그래도 뭔가 사업을 하시려면 개인정보 이슈나 법적인 리스크를 없애야 하는데 분명히 이것을 사업화하시면서 고민하셨을 것 같습니다. 실제 로봇을 출시하는 과정에서 고민하셨을 법한 이슈가 어떤 것이 있었는지 또 어떻게 해결하셨는지 궁금합니다.”]

KT AI Robot 사업단장 이상호 : [“아까 하정우 박사님 처음 발표하실 때도 사업적으로 봤을 때 이 자리가 편하지 않은 자리이기는 합니다. 저희가 모빌리티 로봇, 이동형 로봇에는 필수적으로 거의 대부분 카메라와 라이다 위주로 많이 들어가 있고, 카메라는 장애물인지나 색깔을 구분하기 위한 기본적인 카메라들이 많이 들어가 있는데, 여기서 개인정보 이슈가 꾸준히 제기되어 온 부분은 있습니다.
그래서 저희가 당장 상용화를 하기 위해서 카메라로 얻어진 정보는 저희가 클라우드를 올리지 않고 바로 소멸시켜 버리는 프로세스로 하고 있지만, 아까 말씀하신 대로 로봇이 결국 로봇이 AI 소프트웨어 역량이든 AI 역량이든 결합돼서 궁극적으로 제공되어야 할 마지막 한 가지는 뭐냐 하면 자동화된 서비스인데 이 자동화 레벨을 높이려면 정보가 더 많이 필요한 부분이 있습니다.
모 국내 FMB 대표님과 매장의 자동화를 논의하던 과정에서 아까 정확히 두 번째 질문으로 주셨던 부분, 어떤 손님이 테이블에 앉았는데 로봇이 다가와서 말을 합니다. ‘어제는 회식이 있으셔서 술을 많이 드셨으니 오늘은 이 메뉴 대신에 저 메뉴를 드시면 어떨까요?’라는 추천 서비스를 기획한 적이 있습니다. 그것이 실질적으로 기능적으로도 다 가능합니다. 다만, 민감한 이슈는 그 개인정보, 본인이 어디를 갔다, 어느 식당에서 무엇을 먹었는지에 대한 정보가 공유되는 것을 전제로 기반이 되고 있고, 예를 들어 어떤 특정 회사의 FMB 레스토랑만 갔다 온 이력이 있다면 그 정보를 받아서 이 고객이 같은 그룹 안에 있는 프랜차이즈 여러 군데 일주일 동안 다녀온 이력을 그대로 자동화기기가 그 정보를 가지고 온다면 아까 말씀하신 서비스를 그대로 제공해 드릴 수 있습니다. 오히려 그분들의 건강데이터까지 합산이 되면 ‘오늘은 절대 이 메뉴를 드시면 안 됩니다. 오늘은 차라리 저희가 VIP 고객을 위해서 특별히 준비한 별도의 메뉴에 없는 음식을 제공해 드리겠습니다’라는 궁극적인 자동화 서비스가 될 수 있습니다.
하지만 아직은 그 정도까지 저희가 기획을 하는 수준에 머물러 있고, 이 정도까지 실제로 시장에 서비스를 제공하기 위해서는 여러 가지 형태의 말씀 주신 것처럼 데이터의 보안 부분, 개인정보에 대한 이슈 부분들이 사실 사전에 선결이 되어야만 제공될 수 있는 서비스라서 지금은 아주 기본적인 딜리버리 서비스에만 치중하고 있다고 말씀드릴 수 있을 것 같습니다.
궁극적으로 아까 말씀하신 것처럼 테이블에서 주문하는 메뉴조차 특정 개인이 어떤 주문을 했는지에 대한 기록은 전부 다 통합적으로 관리가 될 수 있는 부분이 있습니다. 이 부분도 각 개인이 해당 정보를 공유하는 것에 대해서 당연히 동의하는 것을 전제로 사업화할 수 있고, 여러 형태의 더 깊은 레벨의, 더 높은 수준의 서비스 레벨이 지금도 제공될 수 있는 역량은 이미 산업계에서는 다 갖춰지고 있다고 말씀드릴 수 있을 것 같습니다. 이상입니다.”]

의장 윤종수 : [“재밌는 포인트입니다. 단골가게에 가면 따뜻한 이유가 내 개인정보를 많이 알아서 따뜻했던 것이라는 것을 새삼 느꼈습니다. 가게 점포별로 따로 개인정보를 수집해서 처리하는 방법도 있을까요?”]

KT AI Robot 사업단장 이상호 : [“그 정도까지 가려면 더 높은 수준, 잘 알지 못하지만 마이데이터 같은 서비스로 결국 다양한 산업계에서 활용될 수 있는 것처럼 그런 식의 빅데이터 댐들이 결국 각 산업계에 맞게 제공된다면 실질적으로 개인화된, 그래서 제가 아까 마지막 자료에 결국 개인화 서비스들 모빌리티나 이동차에 대해서 나온다는 것 중의 하나가 다 그런 내용을 함축해서 담고 있다고 말씀드릴 수 있을 것 같습니다.”]

의장 윤종수 : [“답변 고맙습니다. 이상엽 위원님.”]

위원 이성엽 : [“두 분 발표 잘 들었습니다. 저는 개인정보 이슈보다 다른 것이 궁금해서 간단하게 질문을 드리겠습니다.
아까 네이버에서 초거대 AI가 세계 세 번째 또는 3위라고 이야기하신 것 같은데 매우 놀랐습니다. 그것을 좀 더 구체적으로 어떤 기준으로 해서 우리가 세계 3위가 되는 것인지에 대해서 말씀해 주십시오.
그다음에 KT 사업단장님께는, 저는 KT 광고를 많이 봤는데 이 서비스로봇이나 배송로봇 시장에서 특장점이 있다고 할까, KT가 생각하는 이 시장에서의 비전이나 전략은 말씀을 하지 않은 것 같아서 그것을 듣고 싶습니다.”]

네이버 AI 연구소장 하정우 : [“세계 세 번째라고 말씀드린 것은 출시 혹은 공개한 기준으로 세계에서 세 번째라고 보시면 될 것 같습니다. 첫 번째가 2020년 5월 말 오픈AI에서 GPT-3를 공개했고 그다음에 거의 1년이 지나서 2021년 5월 초 중국의 화웨이에서 PanGu Alpha라는 모델을 공개했는데 모델 자체를 공개했다기보다는 ‘우리는 만들었다’ 그다음에 ‘이만큼 잘하더라’ 하는 어떤 어나운스 이벤트를 열었습니다. 그것이 두 번째 공식적으로, 그리고 세 번째가 저희 HyperCLOVA입니다. 그 이후로 이스라엘에 있는 AI21 Labs라는 회사도 있고, 구글도 공개하고 소위 말하는 1,000억개 이상의 모델 크기를 갖는 모델들이 쭉쭉 카운팅해 보면 그쯤 되는 것 같습니다.
우리나라로 좀 더 좁혀 보면 2021년 겨울쯤에 카카오도 엄청 큰 것은 아닌데 나름 큰 언어 모델을 공개했고 LG AI 연구도 마찬가지 2021년 겨울쯤 공개를 했습니다. 시간순으로 봤을 때 공개 기준으로 전 세계에서 세 번째 정도로 진행했습니다. 실제로 이것들이 서비스에 적용되고 그다음에 새로운 비즈니스 기회를 만들고 생태계를 만드는 관점에서 바꿔보면 오픈 AI가 저만큼 앞서 나가고 있는 것이 맞고, 요즘 코드를 생성하는 것도 이미 상용화되어 있는데 저희는 API뿐만 아니라 네이버 서비스에 굉장히 많이 들어가 있습니다.
중국은 요즘 무엇을 하는지 잘 모르겠습니다. 그런 관점에서 보면 미국, 그다음에 우리나라 이런 느낌이긴 합니다. 유럽은 약간 결이 달라서, 그 정도로 이해해 주시면 될 것 같습니다.”]

KT AI Robot 사업단장 이상호 : [“오늘 KT 서비스 전략에 대해서 충분히 말씀드리지 않았던 것은 산업 전체의 주요 이슈 관련이나 트렌드 부분에서 말씀드리려고 했던 것입니다. 산업용로봇과 협동로봇을 보시면 누가 마켓 리더지, 누가 글로벌 리더지라고 봤을 때는 다 제조업체입니다.
또 보시면 산업용로봇과 협동로봇을 쓰시고 있는 또 이용하고 있는 고객들은 어디지라고 봤을 때 대부분 공장입니다. 서비스로봇으로 점점 시장이 공장 안에 있던 로봇이 이동성을 가지고 밖으로 나오면서 이것이 식당에 가고 호텔에 가고 병원에 가고 건물로 들어오고 있습니다.
이렇게 확장되니까 어떤 문제가 생기냐면 이제 로봇을 사용하는 사람이 전문교육을 받은 엔지니어나 유지보수를 전담으로 하고 있던 특정 고객이 아니라 불특정 다수가 됩니다. 진짜 서비스를 경험하시는 고객들이 일반 사용자분들이 고객이 되는 것이지요. 이런 경험을 한 케이스들이 역사상 없었던 케이스들이 나오는 것입니다. 전혀 로봇이 뭔지에 대해서 교육도 받지 않으신 분들이 갑자기 서빙 로봇에서 설거지하시는 분들이나 알바하시는 분들이 갑자기 로봇을 써야 되는 환경이 되는 것이지요.
서비스로봇 시장이 이렇게 코로나 때문에 급속히 열리다 보니까 물론 많은 글로벌 기업들이 이 서비스로봇 시대가 곧 5년 안에, 10년 안에 온다고 다 예상하고 준비하고 있었습니다. 그런데 이것이 코로나 때문에 준비하지 못한 채 시장이 열려버리는 상황이 된 케이스지요. 아무도 로봇을 조작할 줄을 모르는 사람들이 로봇을 써야 하는 환경이 나왔고, 그러다 보니까 국내 서비스로봇 시장은 그러면 누가 리딩하고 있는지 봤더니 제조사가 아닙니다. 누가 하고 있냐면 그 로봇을 유통하는 업체들이 다 시장을 리딩하고 있습니다.
중국의 푸드봇 가지고 수입했던 업체 VD컴퍼니 또 중국의 푸드봇을 가지고 서비스를 했던 회사가 우아한형제 배민입니다. 알고 보니까 반드시 이 서비스로봇이 활성화되려면 로봇 자체보다는, 단말 하드웨어보다는 서비스를 고객에게 제대로 설계하고 기획하고 딜리버리하는 역량이 더 중요한 환경이 만들어진 것입니다. 그러다 보니까 KT도 똑같은 관점에서 서비스로봇은 궁극적으로 하드웨어에 대한 부분들은 표준화될 것이다. 그러면 결국 차별화는 내가 이 로봇을 가지고 어떻게 소프트웨어적으로 사용하기 쉬운 환경을 만들어줘서 로봇을 전혀 모르는 사람들이 10분, 30분만 교육을 받으면 쓸 수 있는 환경을 만들어내는가가 결국 이 시장은 누가 시장을 가져가느냐에 성패가 달려 있다고 보는 것입니다.
KT는 그것이 LG가 됐건 베어로보틱스가 됐건 어떤 형태의 로봇이 됐건 가져와서 그 위에 서비스를 얹히는 것입니다. 이 로봇을 보니까 이 로봇은 사용자 패턴을 한번 봤더니 이렇게 설계돼서는 안 돼, 제조사와 협업해서 ‘아니야. 이렇게 만들면 안 되고 유저 인터페이스는 이렇게 만들어야 되고 UX는 이렇게 만들어야 돼’ 다시 디자인해 오고 다시 개발해서 저희가 시장에 론칭하면 시장의 사이즈 자체가 획기적으로 클 수 있는 역할을 저희 KT가 서비스 프로바이더라고 말씀드렸는데 궁극적으로 로봇은 중요하지 않다, 중요한 것은 결국 이 로봇을 통해 소비자가 느껴야 되는 경험해야 하는 서비스가 최고 중요하다, 그 서비스 경험은 KT가 디자인한다는 모토로 저희가 사업을 준비하고 있습니다.”]

위원 이성엽 : [“그러면 하드웨어 쪽은 중국이 세계 1위입니까?”]

KT AI Robot 사업단장 이상호 : [“서비스로봇의 시장 자체가 2019년 말에 배민이 푸드봇을 들고 오면서 서비스가 시작됐습니다. 그래서 지금은 자료에도 말씀드렸던 60% 정도는 다 중국에서 만든 하드웨어를 기반으로 그 위에 서비스를 얹어서 제공하고 있다고 보시면 됩니다.
아까 말씀드렸듯이 한국 업체들이 왜 아직 품질이나 가격이나 열세야? 아까 말씀드렸다시피 차근차근 준비해 오다가 코로나로 인해 시장이 갑자기 확 열린 부분이 있고, 국내 대기업이나 국내 제조업체들이 아직 그 수준까지 단기간에 올라가지 못한 측면이 있습니다. 다만, 국내 기업들도 한 2∼3년간 과거 경험이 있어서 내후년 정도부터는 나름 경쟁력 있는 제품들이 시장에 나올 수 있지 않을까 예상하고 있습니다.“]

위원 이성엽 : [“국내 로봇 하드웨어 시장에 대기업도 들어가 있습니까?”]

KT AI Robot 사업단장 이상호 : [“예. LG전자가 들어와 있고, LG전자가 시작 자체는 꽤 오래 됐습니다. 2017년부터 했는데 중국 푸드봇 같은 경우 5년밖에 안 됐는데 4만대를 팔았습니다. 협동로봇의 시장규모를 보면 1년에 연간 수요가 몇 만대가 안 되는데 그 시장을 서비스로봇은 제조업체 하나가 벌써 넘어가 버린 것입니다.
이 시장 사이즈가 어떻게 나왔냐? 정부 지원이 엄청나게 많았습니다. 거기다 코로나가 터지고 비대면 서비스가 어쩔 수 없이 강화되다 보니까 중국 로봇업체들이 최근에 갑자기 급속한 성장을 또 겪고 있고 이후에 지금 약간의 성장통을 겪고 있다고 볼 수 있을 것 같습니다.“]

위원 이성엽 : [“드론도 그렇지 않습니까? 드론도 중국이 다 잡고 있지 않습니까? 드론과 이런 서비스로봇 같은 모빌리티 하드웨어를 중국이 다 장악하고 있네요?”]

KT AI Robot 사업단장 이상호 : [“맞습니다. 아무래도 하드웨어 제작해 보신 경험이 있으신 분들은 아실 것입니다. 중국 센젠에 가면 옛날 청계천에 가면 탱크도 만든다고 말씀드렸지 않습니까? 그 환경이 중국 센젠에는 일주일만 쇼핑하면 로봇 1대가 나올 수 있다는 말이 나올 정도로 부품 생태계가 엄청 잘 갖춰져 있습니다. 그러다 보니까 로봇을 제조하는 업체 입장에서는 기획하고 만들어내고 테스트하는 기간 자체가 아주 획기적으로 짧은 시간 안에 이루어질 수 있는 환경이 만들어져 있는 것이지요. 쉽게 말씀드려서 자동차부품 클러스터처럼 로봇 부품 클러스터가 현재는 이미 다 구축되어 있다고 보시면 됩니다.”]

의장 윤종수 : [“최성진 위원님.”]

위원 최성진 : [“개인정보 이야기가 안 나올 것 같아서 제가 개인정보에 대해 말씀드리려고 합니다. 그런데 그 전에 약간 연관된 이야기여서 먼저 하나만 말씀드리면 아까 AI 편향성을 종합적으로 이야기하면 AI 윤리 이슈일 텐데 재밌는 것은 AI나 로봇도 마찬가지인데 이런 윤리적 이슈가 User Interface, User Experience가 인간형일수록 그 이슈가 증폭이 됩니다. ‘이루다’도 사실은 마찬가지고요. ‘이루다’가 20대 여성을 페르소나로 하지 않고 이것은 깡통 로봇이라고 했으면 윤리적 이슈가 훨씬 덜했을 것입니다. 예를 들면 ‘이루다’에 대한 AI 성희롱 이슈까지 있었으니까요.
그런데 대부분 그런 윤리적 이슈가 AI 서비스를 잘하려다 보면 User Interface 자체를 인간형으로 하다 보니까 그런 논쟁이 증폭되는데 그것은 제가 보기에 우리가 인간이어서 그런 것 같습니다. AI 측면에서 보면 사실은 윤리적 이슈가 제기되는 많은 영역들도 물론 그런 이슈를 제거해야 되겠지요. 데이터를 수집하는 과정에서도 그런 것이 나타나지 않도록 해야 할 것이고, 결과물에서도 그런 것이 나타나지 않도록 해야 하는데 우리가 인간이라는 감정을 배제하고 보면 그것은 AI를 개발하는 측면에서 품질의 이슈입니다. 자율주행자동차 AI 알고리즘으로 간다고 했을 때 이것이 왼쪽으로 갔느냐 오른쪽으로 갔느냐를 우리가 윤리적 이슈로 따지지 않잖아요.
마찬가지로 연어가 물에서 연어회가 뛰노는 것을 한다고 해서 저희가 그것을 윤리적 이슈로 생각하지 않지만 어떤 특정 키워드를 넣었을 때 흑인만 결과로 제시했다, 이것은 굉장히 윤리적 이슈로 우리가 받아들인다는 것이지요.
그런데 결국 어떻게 보면 AI를 개발하는 입장에서는 그런 것을 의도한 것이 아니고 사실은 품질에서 실패한 것이다, 품질에서 이용자들이 좋은 결과물로 받아들이지 못하게 한 것이기 때문에 거기에서 윤리 이슈가 나오는 것이기 때문에 그런 측면에서 그런 문제들을 해결해 나가고 발전시켜 나가야 합니다.
개인정보 관련해서는 크게 로봇이나 AI나 세 가지 이슈가 있을 것 같습니다. 첫 번째는 데이터 사용에 있어서 저작물도 마찬가지지만 정당한 권리를 확보했냐와 마찬가지로 데이터 사용에 있어서 개인정보를 적법한 처리 근거를 가지고 수집해서 사용했느냐의 이슈가 첫 번째 있을 것 같습니다.
두 번째는 결과물, 생산물에서 개인정보 이슈가 발생하는지 발생하지 않는지, 그다음에 세 번째는 아까 최경준 교수님 말씀하셨던 이것을 맞춤형 서비스로 제공한다고 했을 때 그러면 이제 개인의 정보를 또 보관하거나 해야 되는 이슈가 있기 때문에 이 세 가지 정도 있을 텐데, 데이터 사용과 관련해서는 적법한 처리 근거들을 가능한 더 확대시켜 주는 것이 필요하다고 생각합니다. 왜냐하면 해당 데이터를 보관하지 않고 머신러닝에만 사용하고 그 이후는 그런 것이 아닌 부분들이 많습니다.
그래서 그것은 그 개인정보를 수집해서 사용할 뿐더러 계속 보관하느냐 하면 일반적인 개인정보 처리와 마찬가지의 문제가 되겠습니다만 예를 들어 저희의 안면을 저희가 AI 데이터 머신러닝시키기 위해 수집한다고 했을 때 최성진을 식별하기 위해 그것을 쓰는 것이 아니고, 예를 들면 군중에 대한 사진을 놓고 거기에서 무언가를 식별할 수 있는 알고리즘을 학습시키기 위해 그것은 학습에만 사용하고 그 데이터 자체는 폐기했다고 했을 때 다른 이슈들이 있을 것 같습니다.
그런데 저희가 일반적으로 서비스에서 사용하는 개인정보와 관련해서는 기준들이 어느 정도 확립해 나가고 있지만 AI 품질을 높이기 위한 데이터로 사용되는 부분에 대해서는 아까 말씀하셨듯이 30억, 40억이 결코 큰 데이터라고 볼 수 없기 때문에 앞으로 더 큰 데이터들이 필요하기 때문에 일부 엄밀하게 따지면 개인정보가 포함된 부분이라고 하더라도 적법 처리 근거를 최대한 확보할 수 있는 방법을 우리가 개인정보 침해 우려 없이 할 수 있는 방법들을 마련하는 것이 필요할 것 같다는 말씀드립니다.
결과물과 관련해서는 결과물에서 개인정보가 노출되는 것은 결국 품질의 문제이기 때문에 아까 말씀드린 대로 그것이 안 되도록 개발하는 쪽에서 여러 가지 결과물에 대한 알고리즘뿐만 아니라 결과를 이용자에게 산출하기 전에 여러 가지 필터링 장치들을 갖춰서 개인정보가 최대한 노출되지 않도록 하는 것이 필요한데 저런 경우들이 있습니다.
뭐냐 하면 엄밀하게 보면 개인을 식별할 수 있는 정보라고 보기는 힘든데 프라이버시 이슈와 연결돼서 당사자가 이런 경우가 있습니다. 예를 들면 우리가 인터넷에 익명의 게시물을 올리고 거기에 개인의 이름, 주소지 등을 전혀 노출하지 않고 ‘제가 부부사이에 문제가 있는데 이런 경우 어떻게 합니까?’라고 올렸는데 당사자는 안다는 것입니다. ‘왜 인터넷에 그런 글을 올렸느냐?’ 아니면 당사자나 주변인이 그것을 또 알 수 있지 않습니까? 그것은 인격권 측면에서는 굉장히 큰 이슈로 받아들일 수 있습니다.
그러니까 AI가 학습한 결과를 노출했을 때 저작물인 음악이나 미술은 유사성이라는 것도 어떻게 보면 인간의 주관적인 감정이지 않습니까? 이것은 DALL-E와 비슷한, 이것은 Matisse와 비슷한 그림인데 엄밀히 이야기하면 복제물은 아니기 때문에 저작권 침해는 아닌데 유사한 것을 인정해 줄 수 있느냐와 마찬가지로 AI가 내놓은 결과물을 봤을 때 이것은 마치 내 이야기인 것 같은데 내 이야기를 나의 내밀한 부분, 나의 부끄러운 부분을 AI가 이런 식으로 결과를 표출해도 되느냐는 이슈가 있을 수 있습니다. 그런 부분은 앞으로 논의가 많이 필요할 것 같습니다.
저는 그것은 우연적인 결과일 뿐이지, 최성진을 특정해서 아니면 최성진을 식별해서 그런 내용을 만들어낸 것은 아니기 때문에 알고리즘상 문제가 없다면 그것은 용인되어야 하는 것이 아닌가 생각하지만 사람의 감정은 또 그렇지 않기 때문에 그 기준을 어디로 할 것인지 저희가 고민해 볼 필요가 있을 것 같습니다.
맞춤형 서비스 같은 경우 정보주체의 선택권을 강화하는 방향으로 갈 수밖에 없다는 원론적인 말씀드리고 싶습니다. 왜냐하면 아까 식당 이야기했는데 단골이라고 알아봐주고, 서비스 주면 좋아하는 분들도 있지만 20∼30대 젊은 남성들은 ‘식당 주인이 나를 알아보는 순간 그 식당 안 간다’는 인터넷 유머가 있습니다. 조용히 먹고 빨리 가려고 하는데 주인아주머니가 ‘또 왔네’, 아니면 제가 어디에 놀러 갔는데 가령 미혼이어서 여자 친구를 바꿔서 갔는데 ‘그때 오신 분과 다른 분이 오셨네요’라고 하면 굉장히 곤란한 상황이 올 수 있기 때문에 결과적으로는 꼭 다 사전 동의를 받아야 한다고 보지 않는데 그런 상황에서 결국은 이용자가 느낄 수 있는 품질 높은 서비스라는 것은 ‘나는 그런 것이 필요하다’, ‘나는 그런 것이 필요하지 않다’라고 할 수 있기 때문에 이용자가 선택하면 일정한 정보를 저장하고 유지할 수 있는, 그런데 그것을 어떤 서비스에서 일반적으로 제공하면서 Opt-out으로 할 것이냐, 아니면 아주 엄격한 잣대를 들이대서 무조건 사전동의를 받으라고 할 것이냐, 아니면 사전 동의가 필요 없는 적법 처리 근거들을 어느 정도 유연하게 적용해서 가능하게 할 것이냐 이런 부분들을 논의해서 케이스별로 실제로 만들어가야 되지 않을까 싶습니다. 일률적으로 보기는 어려울 것 같습니다. 이상입니다.”]


의장 윤종수 : [“장준영 위원님.”]

위원 장준영 : [“마침 최성진 위원님께서 제가 하고 싶었던 말씀을 하셔서 부연해서 말씀드리겠습니다.
초거대 AI는 오늘 처음 들은 개념이기는 하지만 AI에 데이터 활용이 필수적이라면 앞으로 계속 이런 초거대 AI가 계속 진화되면 수집·이용하는 데이터의 적법성에 대한 챌린지가 계속 늘어날 수밖에 없을 것이라고 생각합니다.
물론 거기에서 사용하는 데이터가 적법하게 수집·이용·동의받은 데이터도 있을 것이고 공개된 데이터도 있을 것이고, 또 그 밖에 우리가 어떤 경로에서 취득했는지 알 수 없는 데이터가 무한이 많을 수밖에 없을 것이라고 예상되는데 이런 경우 수집·이용의 적법성을 계속 우리가 투명하고 강화하는 것이 맞을지가 약간 의문입니다.
지금 최성진 위원님도 말씀하셨다시피 저도 지속적으로 AI를 위한 알고리즘 학습행위에 대해 뭔가 규범적으로 재평가할 시간이 되지 않았느냐는 생각을 했습니다. 어떻게 보면 2년 전에 제재받은 ‘이루다’ 건 같은 경우 그것은 솔직히 AI 학습이 아니라 불완전하게 고객의 정보를 자신의 서비스에 이용했기 때문에 목적 외 이용 이슈가 있었던 것이었고, 우리가 진짜로 AI, 일정한 전제조건 하에서 이루어지는 AI 알고리즘 학습행위 같은 경우 물론 특정 데이터를 이용하지만 잔존물은 개인정보와 무관하다, 단순히 기업의 알고리즘에만 학습하고 개발하기 위해 쓰여진다는 조건이 충족이 되면 그 행위를 더 이상 개인정보 처리행위로 볼 수 있느냐? 이 부분에 대해서 조금은 앞으로 깊은 고민이 필요한 이슈가 아닐까 생각했습니다.
그리고 산업용로봇, 홈로봇까지 앞으로 활성화된다고 하는데 이 부분에 있어서도 고민해야 할 숙제가 물론 수집하는 개인정보, 특히 민감정보 같은 경우도 많이 수집·이용될 가능성이 있다고 생각됩니다. 반면 로봇에서 생산되는 산업용 데이터도 엄청날 것이라고 생각합니다. 특히 기기의 성능이라든지, 어떻게 보면 기계가 더 동작을 원활히 하기 위해서 제조자 또는 유통사가 필요한 산업용 데이터도 충분히 많이 생성될 수 있는데 그 구분을 어떻게 할 것인지에 대해서, 왜냐하면 산업용 데이터 같은 경우 개인정보와 무관하게 유통사, 제조사의 고유 목적이 데이터로 활용될 수도 있는 부분이라는 것을 고려할 때 그 두 가지를 어떻게 구분할 것인지도 앞으로 남은 숙제가 아닐까 생각해 봤습니다.
이상입니다.”]

의장 윤종수 : [“지금 언급하신 부분이 어떻게 보면 아주 핵심적인 이슈 같습니다. 그 부분에 대해서도 의견을 말씀해 주시면 좋을 것 같습니다. 그것이 ‘이루다’ 사건에서도 쟁점이 동의받을 때 ‘서비스 개발’ 이런 식으로 서비스가 어떤 특정되지 않은 상태로 받았을 때 이것에 대한 동의의 적법성 여부도 한번 다루어졌던 것 같은데 지금 말씀하시는 것은 개인정보 이용이 이전에 개인정보 수집·이용하는 형태가 달라졌다, 학습 모델로 쓰기 위한 것은 이전에 개인정보를 수집해서 그것을 이용하는 형태와는 다르기 때문에 그것은 넓게 인정해 주어야 하는 것 아니냐는 부분을 말씀하셨는데 AI 관련해서 이 부분은 첫 번째 허들인 것 같습니다.
혹시 이 부분에 대해서 다른 측면에서 말씀해 주실 분 계십니까?”]

위원 변순용 : [“먼저 첫 번째 개인 맞춤형 내지는 개별화 서비스와 데이터 축적 관련해서는 우리가 일반적으로 생각하면 본인이 동의하면 축적하고, 동의하지 않으면 저장하지 않고 이렇게 하면 되지 않겠나 생각할 수 있지만, 기본적인 디폴트가 그 경우는 저장이라고 생각합니다. 그렇게 개인의 선택의 여지로 놓을 수 있는 개인정보의 범위가 있고, 아예 디폴트로 저장하지 않아야 되는 영역의 개인정보가 분명히 있다고 봅니다. 개인의 선택에 오로지 다 맡길 수 있지는 않을 것이라고 생각해서 그 두 부분을 구분해야 되지 않겠느냐는 생각이 들었습니다.
학습 데이터 같은 경우 제가 하 소장님께 여쭤보고 싶은 것이 사실 학습 데이터를 선정할 때도 굉장히 중요한 문제가 생깁니다. 어떤 학습 데이터를 가지고 하느냐에 따라서 결과물이 달라지기 때문에, 혹시 네이버에서는 학습 데이터를 선정할 때 어떤 기준을 가지고 학습 데이터를 선정하는지, 그다음에 인공지능 일반 데이터를 사용하는 경우와 학습 데이터를 사용하는 것이 또 다를 텐데 이것에 대한 세부적인 동의를 받는 절차가 혹시 있는지, 다른지, 그리고 GPT-3 같은 경우도 기본적인 학습 데이터가 굉장히 편향된 데이터였다는 것이 나중에 밝혀져서 문제가 되기도 했습니다.
우리가 책을 쓰거나 글을 쓸 때조차도 인터넷상에 있는 사진을 아무거나 함부로 올릴 수 없습니다. 굉장히 문제가 되기 때문에 사진 하나하나도 출처를 확인하고 저작권 문제를 확인하는데 그 수많은 데이터의 저작권을 확인하는 절차가 따로 있는지를 여쭤보고 싶습니다.”]

네이버 AI 연구소장 하정우 : [“HyperCLOVA 같은 경우 논문으로 3∼4건이 나가 있는데 거기에 명기가 되어 있습니다. 기본적으로 오픈AI GPT가 학습에 활용한 데이터의 양이 토큰이라고 하는데 대충 단어와 비슷하다고 생각하면 한 3,000억 단어 정도 학습에 사용했고, 구축한 양은 5,000억 단어 정도를 구축했고 그중 3,000억 단어를 사용했습니다. 이 양을 맞추려다 보니까 네이버에 포함되어 있는 거의 모든 서비스들을 긁어모으면 그쯤 되는 것 같습니다.
그런데 네이버의 서비스 대부분이 블로그나 카페, 뉴스 이런 것들이지요. 이런 것들은 네이버의 서비스 개선을 위해서는 사용할 수 있습니다. 동의를 다 받은 데이터들이기는 합니다. 그리고 공개된 데이터들, 블로그 같은 경우 어떤 것들은 완전히 개인용도 공개 안 된 블로그도 있고, 어떤 것들은 다른 사람들이 많이 볼 수 있도록 대외에 공개한 데이터들도 있는데, 공개하지 않은 데이터는 일체 쓰지 않았습니다. 그다음에 메신저 데이터, 일체 쓰지 않고 공개해서 활용할 수 있는 법적 근거 법무팀에서 다 확인해서 그런 데이터들만 가지고 또 지재권 이슈가 애매한 것들도 다 뺐습니다. 그렇게 해서 확보한 것이 한 5,600억 단어, 그중 3,000억개를 가지고 학습을 시켰다고 보시면 될 것 같습니다. 그래서 거기에 있는 것들은 지식인도 있고 블로그도 있고 카페도 있고 아주 많습니다.
일단 그것으로 모델을 만들었고 저희도 모델을 만든 지가 벌써 1년 반이 넘어가다 보니까 돌리다 보니 블로그 데이터가 아주 좋더라고요. 카페나 뉴스는 빼도 블로그 데이터를 가지고 학습하는 것이 훨씬 좋아서 블로그를 좀 더 잘 활용하고, 이런 실험들은 내부적으로 많이 진행하기는 했습니다.”]

위원 변순용 : [“만약 공개할 때 내가 이것을 인공지능에 활용할 수 있도록 동의하겠다가 아니라 그냥 공개한 것이지 않습니까? 공개된 내용에 대해서 학습에 활용하겠다는 것에 대한 동의는 없는 상태지요?”]

네이버 AI 연구소장 하정우 : [“그 부분이 ‘서비스의 개선을 위해 활용하는데 동의합니다’를 체크 받았다고 알고 있습니다.“]

위원 변순용 : [”서비스 개선이라는 것은 굉장히 위험한 광의적 해석 아닙니까? 그러면 어떤 서비스든지 개선과 관련되면 얼마든지 활용할 수 있다는 것으로 너무 광의로 해석해서 쓰시는 것 아닌가라는 생각이 들어서.”]

네이버 AI 연구소장 하정우 : [“저희 법무팀이나 개인정보보호팀 입장에서 봤을 때는 해당하는 블로그 서비스 혹은 네이버 내 서비스들의 품질을 올리는 데 활용할 수 있는 것에 대한 동의라고 판단한 것으로 알고 있습니다. 제가 또 법률전문가는 아니다 보니까 내부 컨설팅을 받아서 진행했다고 보시면 될 것 같습니다.
그래서 저희의 고민은 이 모델들을 외부에서 쓸 수 있도록 하는 것들에 대한 부분이 문제가 될 수 있다고 생각합니다. 그래서 저희는 모델 자체를 공개하지 못하고 있는 것입니다. 모델 자체를 내놓으면 다른 사람들을 위해서 돼버리니까, 그래서 이 부분을 최대가 API 형태로밖에 할 수 없는 것이 그런 부분들이 있는 것 같습니다.“]

의장 윤종수 : [“오병일 위원님.“]

위원 오병일 : [”저는 학습과정에서 사용되는 데이터가 이후 출력 과정과 연결되지 않더라도, 그렇기 때문에 여러 가지 저작권 문제 혹은 불법성의 문제, 혹은 개인정보 문제 여러 가지 측면에서 느슨하게 넘어가도 되느냐는 부분에 대해서 아직 저도 확실한 답을 가지고 있는 것은 아니지만 좀 더 고민해야 할 부분들이 많다고 생각합니다.
최근 네이버 이미지 분석해서 가장 사진이 많이 찍힌 곳이 한강이었다는 기사를 봤습니다. 저는 트위터에서 어떤 분이 ‘이 부분에 대해서 되게 기분이 나쁘다’ 이런 또 트윗을 올렸더라고요. 물론 나를 타깃해서 내 것을 보지 않았다는 것은 알지만 어쨌든 나는 클라우드에 보관한 이 데이터가 아무도 접근하지 않고 안전하게 보관될 수 있으리라고 믿었는데 이런 것을 누군가 나라는 것을 식별하지 않더라도 어쨌든 내 금고에 들어와서 접근해서 데이터를 가져갔다, 이런 식의 신뢰가 깨질 수도 있다는 것입니다.
이것이 현행 개인정보 보호법상 어떻게 해석될지 몰라도, 이용자 신뢰라는 측면에서는 인터넷에 올려놓은, 인터넷 공간에서 어쨌든 내가 보안이 철저하게 돼서 나만 접근할 수 있는 공간의 데이터를 전혀 나를 식별할 수 없다는 이유로 그것을 운영하는 사업체가 접근할 수 있다는 그 가능성 자체가 보안이나 프라이버시 보호에 대한 기대를 무너뜨릴 수도 있는 것이기 때문에 좀 더 신중하게 접근해야 할 필요성이 하나 있다는 생각이 듭니다.
아까 제가 처음에 질문드렸던 것도 저는 저작권의 문제를 질문드렸던 것은 아닙니다. 빅데이터 분석을 위해 저작권을 완화하는 부분에 대해서는 저도 찬성하는 입장이기는 한데, 아까 제가 말씀드렸던 것은 처음에 어떤 아티스트들이 있고 이것을 불법 복제한 큰 데이터베이스가 있는 것입니다. 불법을 활용해서 또 새로운 가치를 만드는 것이지요.
이 부분은 저도 카피레프트(CopyLeft) 주의자이기 때문에 이 부분의 불법성이 맞느냐, 이것은 변론으로 하더라도 불법저작물로 새로운 가치가 생성된 것을 인공지능 학습을 위해서 또 이용을 하는 것, 불법적으로 생성된 가치를 인공지능 학습을 위해 사용하는 것은 괜찮냐, 사실 이 문제를 지적하고 싶었던 것입니다.“]

네이버 AI 연구소장 하정우 : [“두 부분에 대해서, 일단 불법저작물 같은 경우는 학습 데이터 확보를 하기 위해 저희도 내부적인 저장소가 있을 것이고, 외부 같은 경우 저희는 한국어 위키피디아 이런 것들을 활용기도 합니다만 소스에 신경을 많이 씁니다. 예를 들면 그런 것이지요. 소위 말하는 일베에 있는 댓글을 쓰지 않는 이유가 이슈가 될 만한 것들은 아예 원천 차단해서 쓰지 않는다는 정도로 보시면 될 것 같습니다.
반대로 보면 타 기업에서 초거대 AI를 만드는 것이 굉장히 힘든 것이 자체적으로 보유하고 있는 데이터에 한계가 있다 보니까 외부에서 긁어야 되는데 외부에서 긁으려고 봤더니 쓸 수 있는 데이터가 굉장히 부족해서, 말씀하신 그런 것들을 쓰면 안 되니까요. 그래서 나라에서 만들어주면 안 되냐, 이런 이야기가 나오는 것이 그것 때문이라고 보시면 될 것 같습니다.
말씀하신 대로 그런 데이터를 썼다면 그 자체가 리스크 포인트가 되기 때문에 AI 한번 만들어보려다가 회사가 위기에 빠지는 것이 되니까 그런 부분들은 신경을 엄청 많이 쓰고 있다고 보시면 될 것 같습니다.
개인 데이터 부분이 기업보다는 약간 사회적 공감대가 필요한 것이라고 생각합니다. ‘어떤 방향으로 이렇게이렇게 구현해 주셨으면 좋겠습니다’라는 가이드라인이 어느 정도 혹은 공감대가 만들어지면 저희는 거기에 맞춰서 가면 되는데 그것들이 뭔가 공통된 규칙이나 정책이 있는 것이 아니라 어떤 분은 괜찮고 어떤 분은 안 된다고 하고, 어떤 그룹은 괜찮다고 하고 어떤 그룹은 안 된다고 하니까 저희 회사 입장에서는 상당히 보수적으로 입장을 취하고 있습니다.
그리고 미국은 또 완전 반대입니다. 일단 지른다, 이번에 마이크로소프트에서 코파일럿(Copilot)을 가지고 코드를 생성했는데 라이선스 있는 코드가 그대로 복제가 되면서 마이크로소프트 법무팀의 능력을 한번 체크해 보자고 할 정도로 이런 이슈가 생기고 있는데, 미국은 일단 네거티브로 질러놓고 trial and error로 가는 것 같습니다.
그러면 자명하게 하지 않는 쪽보다는 하는 쪽의 기술이 더 발전할 것 같아서, 그렇다면 저희 입장에서는 가급적이면 trial and error를 하되 굉장히 민감한 것들을 조심할 수 있도록 좀 더 이런 것을 정교하게 만들어주셨으면 좋겠다는 부분이 있습니다. 이런 것을 회사가 ‘합시다’라고 하면 어떻게든 혼이 납니다. 오히려 사회 개인정보 포럼이나 혹은 사회과학하시는 분들이 조금 더 가이드를 만들어주셨으면 좋겠다는 부분이 있습니다. 거기에 맞춰서 저희는 기술을 개발하면 되는 것이니까요.“]

의장 윤종수 : [”고맙습니다. 전체 토론을 1시간 배분했는데 금방 지나갔습니다. 많은 이야기가 있는 것 같은데 이제 슬슬 마무리해야 할 것 같습니다.
제가 하나 궁금한 것은 AI가 개인정보 보호에 사용되는 사례는 없습니까? 가령 비식별 처리라든가 아니면 기타 여러 가지 관련해서.“]

네이버 AI 연구소장 하정우 : [”당연히 detector 같은 것을 만들어서 ‘이것이 문제가 있을 수 있습니다’ 하면 detector나 분류를 만들 수 있지요. 실제로 저희도 내부적으로 필터를 만들어 놓는 이유가 그런 것 때문입니다.“]

의장 윤종수 : [“그러면 마무리하겠습니다.
오늘 아주 재미있었습니다. 아까 단골 문제는 새삼스러운 인사이트를 얻은 것이고 또 싫어하는 사람을 생각하면 동의 문제가 아니라 좀 더 많은 데이터를 수집해서 똑똑해지면 눈치코치가 빠른 AI가 ‘쟤는 이런 것을 수집했을 때 저런 것을 싫어하는 사람이야’ 그래서 또 말을 하지 않을 수 있어서, AI가 데이터 수집 처리가 단순 동의 문제가 아니라 오히려 더 고도화될수록 개인정보 보호에 기여할 수 있는 부분도 있지 않나, 그런 측면에서도 고민해 봐야 할 것 같다는 생각입니다. 그것 때문에 아주 재미있었습니다. 오늘 발표해 주신 두 분께 다시 한번 박수를 부탁드리겠습니다. 수고 많으셨습니다.
7차 회의가 1월 세 번째 수요일 18일에 있고, “라이프사이클 전 과정에서 개인정보 안심사회 구현”이라는 제목으로 발표할 예정인데 김우창 위원님 발제가 예정되어 있고, 아직 한 분은 확정이 안 된 것 같습니다. 그래서 확정되는 대로 여러분께 알려드리도록 하겠습니다. 그래서 1월 18일 3시 메모해 주시기를 부탁드립니다. 그것은 ‘미래 사회 변화와 국민 개인정보 안전’이라는 카테고리로 3회에 걸쳐 진행될 예정입니다.
오늘 미래포럼은 이것으로 마치기로 하고, 저희 만찬이 진행될 것 같은데 명동파출소 옆 골목 진사댁에서 진행될 것이니까 참여하시는 분들 오시기 바랍니다.
마무리하면서 위원장님이 이 분야의 전문가이신데 계속 듣고만 계셨는데 여기서 마지막으로 한번 코멘트해 주시는 것도 좋을 것 같습니다.“]

위원장 고학수 : [”제가 많이 배웠고, 연구자 정체성을 가지고 있으면 조금 더 드릴 수 있는 말씀이 많을 것 같은데 제가 위원장 역할을 맡고 있기 때문에 오늘 여러 맥락으로 우리 위원회가 어떤 역할을 해야 할지에 관해서 추가적으로 고민해야 할 숙제를 또 많이 안고 가는 것 같고, 그 점에서 또 감사를 드립니다.
다른 날에 비해서 오늘 참석자 숫자가 많다고 느끼셨을 텐데 특히 뒷자리에 앉은 분들 중 상당수는 저희 위원회 직원들입니다. 제가 몇 차례 참석하면서 이렇게 귀한 말씀 나누는 기회인데 직원들에게도 원격으로 참여할 수 있는 기회가 열려 있기는 했는데 그보다 오히려 더 공식화해서 아예 현장에 참석할 수 있는 기회를 마련하자고 해서 위원회에서 직접 행사 준비하는 팀 말고도 관심 있는 직원들을 오도록 했습니다.
그래서 이것이 단순히 개인적인 호기심 충족이나 자기계발을 넘어서 우리 위원회가 일하는데 당연히 유용한 참고가 되도록 그런 생각을 하고 있습니다.
오늘 두 분 모두 개인정보 보호위원회에 와서 말씀을 나누게 되는 것이 편한 자리는 아니라고 말씀해 주셨는데 어떤 취지인지 알 수 있을 것 같습니다. 저는 그런 문제가 있다고 생각합니다. 특히 AI와 같이 기술개발이 계속 이루어지고 있고 변화무쌍한 영역의 경우에는 현실적으로는 가이드라인을 계속 만들어 나가야 하고 그리고 가이드라인 자체도 업데이트가 필요한데 제가 보는 관점에서 세상에서 가이드라인은 세 가지로 나눌 수 있을 것 같습니다.
한 가지 가이드라인은, 실무자 입장에서 가이드라인이 나왔을 때 보고 정말 5분도 안 걸려서 쓱 본 후 이것은 쓰레기통으로 가도 전혀 무방한, 아무 현실적인 의미가 없는 유형의 가이드라인이 있고, 반대로 정말 유용한 가이드라인은 자기 책상에 꽂아놓고 매일 한 번씩은 열어보게 되는, 그런 의미에서 진짜 유용한 가이드라인이 있습니다. 그 반대 극단의 가이드라인은 이것을 보면서 짜증이 엄청 나면서 이것은 정말 기술에 대해서 1도 모르는 사람이 만들었고, 정말 기술의 발전을 저해하는 가이드라인, 이러면 최악의 가이드라인이 될 것 같습니다. 당연히 그런 것을 저희가 만들면 큰일 나기 때문에 저희도 계속 공부도 하고 가이드라인을 만들더라도 정말 책상에 꽂아놓고 주기적으로 찾아보게 되는 그런 가이드라인을 만들면 좋겠다는 생각을 계속하고 있습니다.
그런 점에서 이런 자리에 오는 것이 마음이 개운치 않으실지라도 오히려 그렇기 때문에 더 자주 소통하면서 이런 생각을 해야 하고 이런 영역에 대해서 어떤 식의 원칙을 가지고 접근해야 할지에 관해서 피드백을 계속 오히려 적극적으로 주실 것을 부탁 말씀을 드립니다.
연말이 돼서 평소보다 말씀을 약간 더 길게 드렸으면 하는데 많은 분들이 알고 계신 것처럼 지금 개인정보 보호법 개정안이 국회에서 진행되고 있습니다. 그리고 현재 법사위 단계이고, 통상적으로는 법사위 그리고 본회의 이렇게 두 단계가 남아 있는데 아주 살얼음을 걷는 것 같은 조심스러운 느낌이 있습니다.
개인정보 보호법이 지난 몇 달 동안 국회를 다니면서 보니까 정말 우리나라에서 모든 정치인뿐 아니라 모든 사람들이 한마디씩 할 수 있는 법이 돼서 자기 손 안에 오면 뭔가 한마디씩은 다 하고 싶어 합니다. 그래서 그것을 조금조금씩 반영한다는 것이 아주 어렵고, 그것을 다 반영하면 교집합이 생기지 않는 영역들이 꽤 있습니다.
아무튼 어찌어찌해서 법사위 단계에 왔는데 제가 보기에 전문가 그 누구도 이것이 100% 만족스럽다고 하는 분들은 아무도 없지 않을까 싶습니다. 다르게 이야기하면 아쉬운 부분은 있지만 아무튼 현실적으로 약간씩 양보하면서 합의를 만들어낼 수 있는 것을 간신히 끌어온 것 아닌가 싶습니다.
여기 계신 분들도 말씀을 시작하면 오늘 날을 새도 부족할 법한 말씀들을 하실 법한데, 개인적으로 아쉬운 점이 있더라도 그것은 큰 틀에서 양해해 주시면 좋겠습니다.
이야기하기 시작하면 이번 개정안도 법을 새로 쓴 것이나 다름없는 수준으로 여러 가지 크고 작은 변화가 있었고, 만약 이번에 통과하고 내년에 또 개정안 이야기하게 된다면 또다시 굉장히 많은 이슈들이 나오지 않을까, 이미 그런 이슈들이 굉장히 많은 상황입니다. 좋게 해석하자면 이쪽 영역에 대한 사회적인 관심이 짧은 시간 안에 정말 폭발적으로 늘고 있는 것 같습니다. 그래서 우리 위원회에 포함해서 개인정보 영역에 대한 전반적인 사회적인 관심과 기대가 높아지고 있는 것을 체감하고 있습니다.
아무튼 이번에 법이 개정이 되어야 그다음 단계 논의를 할 수 있어서 그런 점에서 관심과 성원을 부탁드리고, 개인적으로는 법이 개정되면 그것을 계기로, 다들 아시다시피 거기에 데이터전송권 조항도 있고 이런저런 변화가 있는데 전송권이 어떤 식으로 구현될지에 대해서도 여러 가지 형태의 의견, 기대, 불안감 굉장히 많은 이야기들이 나타나고 있는데 새해에는 그것을 계기로 흔히 디지털 대전환(Digital Transformation) 이런 표현을 쓰는데 그런 디지털 트랜스포메이션이 현실화하고 일반인들이 체감할 수 있는, 체화할 수 있는 방향으로 가는 어떤 의미에서는 첫 단계로 위원회가 코디네이터 역할을 하면서 본격적인 변화를 모색하려고 합니다.
그런 맥락에서도 관심을 가져주시고, 이 포럼, 또는 다른 경로를 통해서도 의견이 있으시면 항상 열심히 듣도록 할 테니까 관심을 가져주시기를 부탁드리겠습니다. 고맙습니다.“]

의장 윤종수 : [“이상으로 「2022-2023 개인정보 미래포럼」제6차 회의를 마치겠습니다.“]

해당 페이지의 만족도와 소중한 의견 남겨주세요.

등록