[IT·HW.SW사용법]/최근·최신 IT정보

액센추어,「Pocket Supercomputer」시연

기쁨조미료25 2008. 2. 6. 12:31
액센추어,「Pocket Supercomputer」시연

Tom Espiner ( ZDNet UK )   2008/02/05  
Accenture
액센추어의 ‘포켓 슈퍼컴퓨터(Pocket Supercomputer)’는 씬 클라이언트(thin client)처럼 작동하는 전화기이다. 관련된 정보를 확인하고, 링크할 수 있는 서버에 실시간으로 이미지와 동영상을 보내기 위해 사용된다.


휴대 전화에 있는 카메라는 책과 같이 동영상을 찍는 데 사용된다. 액센추어에 따르면, 서버소프트웨어는 서적의 표지를 인식할 수는 있으나 내용을 읽는 것은 아직 안 된다. 만약 책표지를 인식할 수 있다면 어디에서 구매할 수 있는지나 책의 역사 및 가격을 알려 줄 수 있다.

서버에서 모바일 장치로 프로세싱을 이동시키는 것은 이미지 검색과 저장을 위해 사용할 수 있는 사이즈 및 프로세싱 파워의 한계가 있다.

액센추어의 프로젝트 수석 연구원인 프레드릭 리나커는 “이것은 로봇 프로젝트의 시작과 비슷하다”며 “우리는 처음엔 하나, 그런 뒤에 로봇에 두 개의 랩톱을 추가했다. 너무 무거워져서 몸체에서 브레인을 따로 떼어놓았고, 몸체는 무선으로 연결해 다른 장소에 뒀다”고 설명했다.

다음 단계는 모바일 장치를 이용한 ‘브레인’ 중심 액세싱이었다.


액센추어 연구실의 시연에서 리나카는 윈도우XP 랩톱을 사용했다.

비디오 검색은 데이터베이스에 있는 이미지를 액세스 할 수 있게 셋업할 수 있다. 예를 들면 기술은 그림의 이미지를 인식할 수 있다 리나카는 ‘진주 목걸이를 한 소녀’ 이미지를 사용해 시연해 보였다. 전화기의 카메라가 그림의 비디오 화상들을 찍었을 때 데이터베이스의 검색은 그림의 정보 결과를 알려주고 같은 타이틀의 최신 영화를 전화에 연결했다.


위의 사진에 보이는 일본어로 된 수프 포장처럼 라틴 문자가 아닌 문자로 적혀 있는 음식물 포장 이름이라도 패킷에 의해 음식물은 확인될 수 있다.

액센추어는 이것이 재고 관리용 및 직원들이 다른 전기 부품을 알 수 있게 훈련할 때 사용할 수 있다고 말한다.

3D 이미지는 또한 다른 각도에서 허상을 볼 수 있게 하기 위해 전화기에 업로드 할 수 있다. 액센추어의 모션 트래킹 기술은 원래 인텔에서 개발한 오픈 컴퓨터 비전이라고 불리는 프리 라이브러리 알고리즘을 사용한다. 이것은 창고 재고의 특정 부품에 대하여 직원들을 가르칠 때 사용할 수 있다.


외국어와 캐릭터는 사용자의 언어로 번역될 수 있고, 사용자는 대상이 무엇인지 알아 낼 수 있다. 검색 결과를 개인화할 수도 있다.

전화는 초당 10프레임의 동영상을 촬영하고, 이미지는 low-latency 커뮤니케이션 미디엄인 video calling을 사용하여 실시간으로 데이터베이스로 보낸다.

비디오 검색을 위해 사용되는 데이터베이스는 자동으로 만들어 질 수 있다 액센추어는 웹 크롤을 하기 위해 스파이더를 작성했고, ‘동양요리’와 같은 특정 테마의 이미지를 다운로드 한다.


위 사진에서 리나커는 데이비드 로이가 개발한 SIFT(Scale-Invariant Feature Transform)이라 불리는 알고리즘을 통해 이미지가 움직이고 물체 확인에 필요한 정확한 특징을 설명했다.

리나커에 의하면, 소프트웨어로 jpeg으로부터 특징을 발췌하고, 초당 10프레임을 찍는 카메라의 풀 프레임레이트에 데이터베이스 이미지를 매칭한다. 매칭이 되면, 서버의 소프트웨어는 정보를 가져와서 유저의 전화기에 다시 돌려보낸다.

리나카에 의하면, 비디오를 가진 이점은 만약 여러분이 각도가 나빠서 이미지가 좋지 않을 때도 다른 이미지를 찍어 공급할 수 있다는 것이다.


연구원들은 현재 포켓 슈퍼컴퓨팅에 기능을 추가하는 작업을 하고 있다. 리나카는 시스템이 텍스트를 한번에 인식해 인터넷에 링크할 수 있기 때문에 옵티컬 캐릭터 인식 기능을 추가하기를 원한다고 말했다.

캐릭터 온라인 검색은 유튜브와 같은 비디오 검색 사이트와 결합될 수 있다.

또 액센추어는 어떻게 시스템에 음성 인식 소프트웨어를 추가하는지를 연구하고 있다. 사용자가 한 가지 언어로 전화기에 단어나 어구를 말하는 것을 가능케 할 것이고, 다른 언어로 다시 말해주는 전화기를 가질 수 있게 할 것이다.

비디오와 오디오는 싱크할 수 있어서, 사용자는 전화에 사물이나 제목의 이름을 말할 수 있고, 관련된 정보를 가지고 있는 비디오를 돌려받을 수 있을지도 모른다.

또 연구원들은 똑같은 기능의 이미지를 돌려주는 현재의 검색보다 어떻게 하면 유사한 특징을 가진 이미지를 돌려주는 것을 비디오 검색에서 할 수 있을지에 대한 연구를 계획하고 있다.

예를 들면, 사용자가 어떤 타입의 CPU룰 사용하는 비디오인가 하는 정보를 돌려받는 것이 아니라, 특정 CPU에 대한 정보뿐 아니라, 유사 사양을 가지고 있는 CPU에 대한 정보도 받을 수 있는 것이다

연구원들은 3년 내에 시장에 내놓을 수 있는 제품을 만들 수 있기를 바라고 있다. @