Bixby Developer Center

Guides
References

개요

Bixby Developer Platform 요약

Bixby는 사용자가 빠르게 정보를 찾고 원하는 것을 할 수 있도록 돕는 가상 개인 비서입니다.

Bixby는 이미 다음과 같이 다양한 일을 할 수 있습니다.

  • 식당, 공항 교통편, 호텔 숙박 등 다양한 예약
  • 항공편, 날씨, 레시피 등 유용한 정보 조회
  • 콘서트 티켓, 꽃과 같은 상품 구매
  • Spotify로 좋아하는 음악 재생
  • 외식 후 지불해야 할 팁 계산(식당 예약은 기본!)

개발자인 여러분은 Bixby의 지식 체계를 넓히고 Bixby에게 새로운 일을 가르칠 수 있습니다. 예를 들어 운동할 때 즐겨 듣는 플레이리스트를 재생하는 법이나 엄마의 마음에 쏙 드는 발렌타인데이 선물을 고르는 법을 Bixby에게 학습시킬 수 있습니다. Bixby에게 가르칠 기능은 여러분이 개발하는 캡슐에 통합됩니다.

Bixby만의 차별화된 특징

Bixby에 대한 개발은 프로그램을 작성하는 주체가 개발자가 아니라 AI(인공 지능)라는 점에서 기존 소프트웨어 개발과 차이가 있습니다. 개발자는 모델링을 수행하여 구현 중인 feature나 도메인을 Bixby에게 학습시킵니다. 개발자가 만든 모델과 기타 제공되는 모델을 사용하여 Bixby는 사용자의 요청이 이루어지는 즉시 이를 충족하는 프로그램을 작성합니다. 다이나믹 프로그램 제너레이션이라고 하는 이 기능은 다른 개인 비서와 구별되는 Bixby만의 주요 특징입니다. 다른 접근 방식을 사용하는 경우에는 모든 사용 사례와 인터랙션을 처리하는 로직을 하드 코딩해야 합니다. 즉, 해당 사용 사례에서 매번 개인 비서가 같은 질문을 하지 않도록 호출되는 서비스, 사용자에게 질문하는 시기, 머신 러닝을 적용하는 방식을 정해 놓아야 합니다.

반면 Bixby의 경우, 개발자는 Bixby에게 이러한 프로그램을 작성하는 방법을 학습시키기만 하면 됩니다. 적절한 모델링과 training을 통하여 개발자는 사용자의 다음과 같은 말을 처리하는 캡슐을 만들 수 있습니다.

"다음 금요일에서 3일 후에 JFK에서 샌프란시스코로 가는 직항 편도 항공편의 창가 좌석 예약해줘"

Bixby는 순식간에 다음과 같은 작업을 수행하는 40여 단계의 프로그램을 생성할 수 있습니다.

  • “다음 금요일에서 3일 후”의 정확한 날짜 계산
  • 샌프란시스코 인근 공항 검색
  • 다양한 데이터 type 간 변환
  • 기타 다양한 작업

다이나믹 프로그램 제너레이션은 사용자와의 모든 인터랙션을 처리할 뿐 아니라 루프, 이터레이션, 트랜잭션 등의 훨씬 복잡한 오퍼레이션(operation)도 구현할 수 있습니다. 이를 통해 보다 일관되고 안정적이면서 간단히 유지 관리할 수 있는 기능을 더욱 쉽게 제공할 수 있습니다.

다음은 사용자 요청이 발생할 때 Bixby가 동작하는 방식을 보여주는 다이어그램입니다.

platform overview diagram

(확대 이미지를 보려면 이미지 선택)

먼저 Bixby는 사용자의 자연어 요청을 받아 인텐트(intent)로 변환합니다. 인텐트(intent)는 사용자가 원하는 동작에 대한 구조화된 표현입니다. 개발자는 Bixby에게 자연어 발화를 학습시켜 Bixby가 사용자의 초기 요청을 이해하고 인텐트(intent)를 생성하도록 합니다.

그런 다음, Bixby가 인텐트(intent)와 개발자가 작성한 모델을 사용하여 실행할 프로그램, 즉 plan을 동적으로 생성합니다. 모델은 concept(Bixby가 아는 것)과 action(Bixby가 할 수 있는 것)으로 구성되며, 인텐트(intent)는 goal(사용자가 원하는 것)을 의미합니다. Bixby는 concept과 action을 사용하여 goal을 달성하기 위한 프로그램을 작성합니다.

마지막으로, Bixby는 plan을 실행합니다. Bixby가 action에 도달하면 개발자에 의해 작성된 JavaScript 코드를 실행하고 백엔드 웹 서비스에 연결할 수도 있습니다. Bixby action은 디바이스에서 애플리케이션을 시작할 수도 있습니다. 하지만 Bixby는 시작한 애플리케이션과 인터랙션하지는 못합니다.

초기 요청부터 Bixby의 최종 응답에 이르기까지 Bixby와 사용자의 컨버세이션(conversation)은 사용자 요청과 Bixby의 응답 세트로 구성됩니다. Bixby의 응답에는 음성/텍스트 dialog, 렌더링된 view(예: "샌프란시스코 유니언 스퀘어에 있는 4성급 호텔 찾아줘" 같은 요청에 대한 응답으로 호텔 목록 나열) 및 프롬프트가 포함될 수 있습니다. 사용자 요청에 대한 Bixby의 응답 세트를 Bixby의 moment라고 합니다. moment는 사용자의 요청에 대한 최종 결과일 수도 있고, Bixby가 사용자에게 자세한 정보/설명 또는 사용자로부터 수집하거나 과거 인터랙션을 토대로 가정한 정보에 대한 확인을 요청하는 것이 될 수도 있습니다. 예를 들어, 승차 공유 캡슐은 사용자가 주로 선택하는 차종을 학습한 후 확인 moment에 해당 차종을 미리 선택하여 제시할 수 있습니다. 개발자는 layoutdialog를 사용하여 이러한 moment를 디자인합니다.

개발자가 모델, 코드, layout, dialog를 통합해 캡슐을 생성한 후 이를 제출하여 승인을 받으면 Bixby 마켓플레이스를 통해 모든 사용자가 해당 캡슐을 사용할 수 있습니다. 첫 캡슐을 생성하고 테스트하는 방법은 빠른 시작 가이드에 나와 있습니다.

Bixby에게 새로운 세상을 알려 줄 준비가 되었다면 지금 시작해 보세요!