..

Search

6. 딥러닝 사례

딥러닝에서 사용되는 알고리즘


구글 이미지 인식

- 글씨나 로고 인식
- 유명한 건축물의 이름을 알려주거나 얼굴 표정의 의미를 알아내기도 한다.
- 구글은 클라우드비전 API를 이용해 이미지 검색 기술 및 추천 서비스, 혐오사진을 걸러내는 프로그램 등을 개발할 수 있다.
- 유튜브에서 고양이 이미지 1000만장을 랜덤하게 추출한 뒤 그 미이지에서 200x200 픽셀의 크기 이미지를 대량으로 무작위로 잘라내어 데이터를 만듦. 그리고 데이터들을 12층의 신경망을 이용한 학습을 진행. 학습을 통하여 귀가 뾰족하다, 코 주변에 털이 있다 등의 특징으로 고양이인지 분류할 수 있었음.

 

<개와 고양이 이미지를 통한 이미지 인식>

 


영상과 음성 합성

- 오디오를 이용해서 비디오의 입술 움직임을 합성, 새로운 동영상을 만드는 곳에 적용할 수 있습니다.
- 참조 : https://youtu.be/MVBe6_o4cMI

 


흑백 사진에 색상 복원

  

- 흑백 사진, 영상을 컬러로 복원하는 곳에 적용 가능
- 참조 : 
https://dl.acm.org/citation.cfm?id=2925974
http://hi.cs.waseda.ac.jp/~iizuka/projects/colorization/en/

 

- 딥러닝 네트워크는 사진에서 일어나는 실제 패턴을 학습합니다.
- 재복원하려면 하늘은 대체로 파란색이고 구름은 하얀색/회색을, 잔디는 초록색을 띠고 있다는 점을 학습하는 것입니다.
- 이러한 작업도 인간의 개입 없이 과거 경험을 바탕으로 스스로 학습을 합니다.
- 예를 들어서 두 개의 흑백 사진에 대한 실제 색이 입혀진 사진과 컴퓨터가 색을 추측하여 입힌 사진이 있습니다.


CSI스타일의 픽셀 복원



- Pixel Recursive Super Resolution
- 딥러닝 네트워크를 이용해 얼굴 이미지를 저해상도로 변환시킨 후 각 이미지가 무엇과 유사한 형태를 보이는지 예측.
- 사진의 해상도를 극명하게 강화시키는 작업.
- 참조 : https://arxiv.org/pdf/1702.00783.pdf?xtor=AL-32280680


텍스트 읽기

    

- Oxford Visual Geometry group은 딥러닝을 이용하여 “문자 형태를 읽어냅니다.”
- 사진이나 동영상의 텍스트를 읽어내는 시도로써 BBC 뉴스의 비디오에서 텍스트를 읽기 위한 노력입니다.
- 참조 : http://www.robots.ox.ac.uk/~vgg/


로봇기자

  

- 2016년 1월부터 인공지능 로봇이 작성한 증권가 소식 기사를 보도.
- 주식시장이 마감되면 로봇 기자가 증시와 관련된 자료를 이용해 0.3초 만에 기사를 작성.
- 스포츠 경가, 날씨, 재난재해 등 데이터를 토대로 쓰는 기사를 로봇 기자가 하고 있음.


로봇청소기

  

- 로봇 청소기는 단순히 바닥을 돌아다니며 청소만 하는 것이 아니라, 여러 가지 센서를 이용하여 사람처럼 생각하고 방의 구조, 크기, 가구 배치 등을 파악하고 저장하여 다음에 청소할 때 활용.


무인자동차

- 무인 자동차 또는 자율주행자동차는  크게 두가지 역할을 함.
- 영상 정보를 모으는 카메라와 물체의 위치와 크기 등을 파악하는 레이더가 있음.
- 카메라는 차선, 신호등, 교통 표지판 등 형태와 색으로 이루어진 정보들을 파악하는데 사용.
- 레이더는 물체의 속도, 위치 변화 등 움직임에 관련되 정보를 알아냄, 또한 탑승자의 건강상태나 기분을 파악하고 알맞은 조치를 취하기도 함.
- 참조 : https://youtu.be/aKed5FHzDTw

   


번역

- 구글 번역기는 자동으로 사진 속 외국어를 원하는 나라의 언어로 번역 가능.
- 알고 싶은 물체 위에 카메라만 대고 있으면 이미지 속 외국어를 번역해 줍니다.
- 세계 각국의 많은 언어를 번역할 수 있습니다.

  


스마트진단

- U-헬스케어란 유무선 네트워크를 활용하여 언제 어디서나 건광관리 및 의료 서비스를 이용.
- 랩 온어 칩(lab on a chip) 기술은 각종 바이오센서를 칩 위에 오밀조밀하게 배치한 진단 기기로, 아주 적은 양의 피나 침, 대변만 있으면 질병 여부를 판단하는 검사.
- 분석 시간이 짧고 시료를 한꺼번에 분석할 수 있어 U-헬스케어에 적합한 기술.
- 의료계에 진입장벽 및 여러 문제 제기 가능성으로 인해 인해 당장 실현은 어려우나, 언젠가는 딥러닝이 적용될 것이며 시도 중에 있음.
  


지진과 빅데이터

- 지진의 빅데이터를 분석하여 조기 예측을 하고 경보를 울리기도 함.
- 하버드 과학자들은 딥러닝을 사용하여 컴퓨터에 지진 예측에 사용된 계산인 점탄성 계산을 수행하도록 함. 딥러닝 적용은 계산 시간을 50,000%까지 향상.
- 현재 컴퓨터의 판단 능력의 한계로 아직까지 지진의 조기 예측이 어렵지만 딥러닝 기술이 반드시 필요하며 여려 시도 중에 있음.

  


미술

- 유명 화가의 작품 따라 하기.
- Style transfer는 기존의 화풍을 따라하여 새로운 이미지를 만들어 내는 딥러닝 기법입니다.
- 참조 : https://github.com/luanfujun/deep-photo-styletransfer/blob/master/README.md

  

  


손글씨

- 이 손글씨는 손이 아닌 컴퓨터가 쓴 문장입니다.
- 컴퓨터가 만든 문장이나 예술 작품을 제가 계속 보여주고 있지만, 컴퓨터는 현재 손글씨까지도 가능합니다.
- 토론토 대학의 Alex Graves는 컴퓨터에게 다양한 스타일의 손글씨를 가질 수 있도록 훈련시켰습니다.
- 참조 : http://www.cs.toronto.edu/~graves/handwriting.html


인구 통계 및 선거 결과 예측

- 컴퓨터가 자동차를 현지화하고 인식하였습니다.
- 22백만이 넘는 자동차를 모델, 차체 타입, 연식을 인지하였습니다.
- 이 모델은 실제로 자동차를 보고 각 지역의 인구 통계를 예측합니다.
예)15분 동안 지나가는 차를 지켜봤을 때 세단의 수가 픽업트럭의 수보다 많다면, 그 도시는 다음 대통령 선거 때 민주당을 뽑을 가능성이 더 높습니다.(88%의 확률), 만약에 그 반대라면, 공화당을 뽑을 확률이 더 높습니다.(82%의 확률)


Deep dreaming

- 2015년 후반에 구글 연구원들은 사진의 특성을 강조할 수 있도록 딥러닝을 이용하였습니다.
- 컴퓨터가 기존에 존재하고 있는 사진을 환영시(hallucinate)하는 것.
- 이렇게 구현된 사진이 종종 우리의 꿈(dream)과 닮아 과학자들이 Deep Dreaming이라고 부르게 되었습니다.


인공지능은 도청을 피하기 위해 자체 암호화를 발명하고 해킹도 함.

- Google Brain은 보안 목적으로 두 개의 신경망을 만들었습니다.
- 하나는 자체 암호화 알고리즘을 만들어 메시지를 보호하고
- 다른 하나는 이를 해독하려고 합니다.
- 새로운 암호 메커니즘을 고안했지만 해킹하는 데는 능숙하지 않음.


딥러닝 네트워크를 생성하는 딥러닝 네트워크

- Neural complete 은 새로운 딥러닝 네트워크를 생성할 수 있는 깊은 학습 코드입니다.
- 파이썬으로 작성되었을 뿐만 아니라 파이썬 코드를 생성하는데도 교육을 받았습니다.


연습문제