[AWS 퍼블릭 섹터 데이] 어느 나라든 공공기관이 데이터 보유량 가장 많아…데이터 오픈하면 신뢰 생기고 일자리도 많아질 것
상태바
[AWS 퍼블릭 섹터 데이] 어느 나라든 공공기관이 데이터 보유량 가장 많아…데이터 오픈하면 신뢰 생기고 일자리도 많아질 것
  • 우연주 기자
  • 승인 2024.07.05 01:24
  • 댓글 0
이 기사를 공유합니다

디지털공공인프라, 효율성과 신뢰 기여
투명성·민주주의에 기여하고 예산도 절약
생성형 AI 강조…”데이터가 차별화 포인트”
[사진=녹색경제신문]
윤정원, AWS 공공부문 대표와 클린트 크로시어 총괄. [사진=녹색경제신문]

[녹색경제신문 = 우연주 기자] 아마존웹서비스(AWS)가 오늘 코엑스에서 ‘AWS 퍼블릭 섹터 데이 서울 2024’를 개최하고 디지털공공인프라(DPI)를 강조했다.

DPI는 공공기관이 그 누구보다 방대한 데이터를 갖고 있다는 점을 활용한다.

곽재도 인공지능산업융합사업단(AICA) 본부장은 “데이터를 가장 많이 갖고 있는 것은 어느 나라 가릴 것 없이 국가와 공공기관이다”며 “예를 들어, 우리나라에서 데이터를 가장 많이 보유한 기관은 국립중앙도서관일 것이다. 모든 분야에서 데이터를 아카이빙하고 국민이 사용할 수 있도록 할 법적 의무가 있는 기관”이라고 설명했다.

DPI는 이러한 공공기관의 데이터를 국민에게 개방함으로써 생성형 AI 등 기술 발전의 기반이 된다.

기조연설자로 나선 클린트 크로시어(Clinton E. Crosier) AWS 항공우주·위성 총괄은 “온라인에 공개된 공공 정보는 모두 DPI로 볼 수 있다”며  “DPI는 효율성을 강화한다. 결국 정부의 목표는 시민들에게 더 좋은 서비스를 제공하는 것 아니겠나”고 말했다.

DPI를 통해 정부와 국민 사이의 신뢰가 증진될 것이라는 기대다.

크로시어 총괄은 “공공 오픈데이터는 정부와 국민을 연결하는 수단이다. 또, 투명성과 신뢰를 만들면서 민주주의를 가속시킬 것”이라고 말했다.

DPI를 통해 예산을 절약한 사례도 들었다.

크로시어 총괄은 “인도 정부는 DPI를 도입하면서 2013년에서 2019년 사이 34억 달러(한화 약 47조 원)를 아낀 것으로 추정된다고 발표한 바 있다”고 말했다.

영국의 바이오뱅크도 DPI가 공공에 기여하는 좋은 예다.

크로시어 총괄은 “영국의 바이오뱅크는 50만 명의 자원봉사자가 기부한 유전정보를 갖고 있었다. 이를 외부에 전면 공개하면서 세상에서 가장 큰 리서치 개발 플랫폼이 됐다”고 말했다.

이러한 DPI를 구축하기 위해서는 몇 가지 규칙이 필요하다.

크로시어 총괄은 “먼저 또렷한 정책과 표준이 필요하다. 예를 들어 어떤 포맷을 사용할 것인가, 기계가 읽기에 적절한 구조인가, 다양한 정부 기관이 공유하기에 적절한가 등을 미리 정해둬야 한다”고 말했다.

중앙집중화된 데이터 카탈로그도 중요하다.

크로시어 총괄은 “교통을 담당하는 부서가 건강 관련 부서에 데이터를 보내는 것이 어렵지 않으려면 데이터 카탈로그가 잘 구축돼 있어야 한다. 검색이 쉬워야하고 데이터가 위계에 맞게 정리돼 있어야 한다”고 말했다.

오픈소스화하는 것과 협업은 공공데이터를 오픈하는 것의 긍정적 여파다.

크로시어 총괄은 “한국 정부가 교통 데이터를 오픈하면 그 데이터를 활용해 앱을 만드는 회사들이 생긴다. 그러면 직장이 생기고 경제에 기여하게 된다”고 설명했다.

생성형 AI에 대해서도 상당 시간이 할애됐다.

김경윤 AWS 솔루션즈 아키텍트 매니저는 “작년만 해도 생성형 AI에 대한 질문들이 추상적이고 개념에 관한 것이었다면 1년 사이에 질문이 실용성에 관한 것들로 변했다”며 “생성형 AI는 1년 안에 비즈니스에 큰 영향을 주는 역할을 할 것이라는 자료가 있다”고 말했다.

아마존 베드락(AWS가 제공하는 생성형 AI 제작 지원 플랫폼)에도 들어 있는 클로드(Claude)에 대한 언급도 있었다.

김 매니저는 “챗GPT와 제미나이가 서서히 성능을 올려가고 있지만 클로드는 그 둘 보다 높은 점수를 기록했다”며 “생성형 AI의 특징 중 하나는 ‘끊임 없는 경쟁’이다”고 말했다.

클로드가 그래프 이미지를 읽고 이해한 뒤 분석하고 자료를 만드는 모습도 공개됐다.

첫 번째 사진은 유전체분석비용이 점차 감소되는 도표를 담고 있고, 두 번째 사진은 시간 순으로 유전체 관련 유의미한 사실들을 나열한 것이었다.

이 이미지들을 클로드에게 주고 분석을 요청하자 클로드는 그래프에서 점과 숫자를 읽어냈고 기존 언어지식을 기반으로 그 의미를 해석했다.

김 매니저는 “이 시연은 ‘멀티 모달’을 보여준다. 과거에는 AI를 기능별로 나눠 발전시켰다면, 이제는 하나의 모델이 여러 개를 다 소화하는 멀티 모달이 트렌드다. 텍스트를 읽고 그림의 격자 사이 꼭지점의 의미를 읽는 등 다양한 작업을 수행할 수 있게 된 것”이라고 설명했다.

이어 클로드에게 위 내용을 강의자료로 만들어 달라고 요청하자, 클로드는 단순한 파워포인트 슬라이드가 아닌 자바스크립트를 사용한 인터액티브 슬라이드를 만들어 냈다.

김 매니저는 “여기서 끝나는 것이 아니라, 다음에 또 자료를 분석해야 할 일이 있다면 이 자료를 또 쓸 수 있을 것”이라고 말했다.

이미 현장에서는 반응이 있는 것으로 전해졌다.

김 매니저는 “지난 주 세종시에서 이 내용을 보여드렸더니 보시는 분들이 웃더라. 왜 웃냐고 물어보니 ‘지금 내가 하고 있는 일이다’는 반응이었다”고 말했다.

생성형 AI를 위해서는 데이터가 중요하다는 말도 덧붙였다.

김 매니저는 “결국엔 어떤 데이터를 갖고 있느냐에 따라 차별화될 수밖에 없다. 데이터가 어디에 어떻게 정리돼 있고, 어떻게 가공돼 있고, 분석을 위한 준비가 얼마나 되어 있는지가 관건”이라고 말했다.

책임있는 AI에 대한 관심도 필요하다.

김 매니저는 “AI를 사용해서 사회에 도움이 되어야지, 해가 되어서는 안 되지 않겠나”며 “‘책임있는 AI’를 통해 사회적 신뢰를 얻을 수 있어야 한다”고 말했다.

생성형 AI에 관한 규제에 대해서도 언급했다.

김 매니저는 “미국은 행정명령이라는 형태로, 유럽은 법령의 형태로 생성형 AI 관련 규제가 윤곽을 드러내고 있다. 우리나라도 이 추세에서 크게 벗어나지는 않을 것”이라고 말했다.

우연주 기자  lycaon@greened.kr

▶ 기사제보 : pol@greened.kr(기사화될 경우 소정의 원고료를 드립니다)
▶ 녹색경제신문 '홈페이지' / '페이스북 친구추가'

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.