Next UX

Next UX
Photo by Ilnur Kalimullin / Unsplash
Next Software
세계적으로 존재하는 다양한 프로덕트의 카테고리 중에서 제일 빠르게 발전하고 있는 분야이자 기술적으로 선도하고 있는 분야는 단연코 소프트웨어 시장이라고 생각한다. 다른 시장과는 다르게 scalability가 크고 risk가 적기에 많은 사람들이 도전하고 있고 그만큼 빠른 발전이 이뤄진다. 이번 글에서는 소프트웨어 시장 안에서 우리는 어떠한 미래를 준비해야 되는지 다뤄보자. New Software 작년 말 ChatGPT의

전 편에서 LLM으로 파생되는 앞으로 바뀌게 될 Software에 대해서 알아보았다. 이번 편에서는 LLM으로 파생될 Next UX에 대해서 알아보자.

대화란

지금까지 우리가 사용하던 온라인 소프트웨어를 생각해보면 대체로 웹과 앱의 형태를 가진다. 하드웨어로는 랩탑과 모바일일 것이다. 웹/앱이라는 인터페이스를 이용하여 유저는 하드웨어를 통해 서비스와 대화하게 된다.

웹과 앱의 등장은 대화의 새로운 장소를 제공하였다. 그에 반면 머신러닝과 LLM은 대화의 새로운 방식의 등장이라고 볼 수 있다.

Software 1.0일 때에는 deterministic한 알고리즘을 통해 대화할 수 있었다. 이커머스 서비스라고 생각해보면 유저가 어떤 키워드를 검색하면 그 키워드를 포함하고 있는 상품들을 찾아서 유저에게 보여준다. 유저는 "의도"를 말했고 서비스는 "상품"을 말했다. SNS 서비스에서는 유저가 서비스에 접속하면 그 유저가 팔로우하고 있는 유유저들의 피드가 뜬다. 유저는 아무 말하지 않았고 서비스는 "피드"를 말했다.

Software 2.0을 생각해보자. "Next Software"에서 말했듯이 Software 2.0이 도입되어도 Software 1.0이 없어지지 않는다. 오히려 Software 2.0과 상호보완적인 관계를 가진다. 머신러닝은 크게 2가지로 나뉠 수 있다. 인식형 AI와 생성형 AI이다. 분류, 예측, 추천 문제가 인식형으로 분류되며 이미지 생성, 오디오 생성, 이미지 편집, 텍스트 생성 문제가 생성형으로 분류된다.

Software 1.0의 예시였던 이커머스 서비스와 SNS 서비스에는 Software 2.0의 인식형 AI가 모두 도입되었다. 이커머스에서는 여전히 유저가 "의도"를 말할 때 서비스는 "상품"을 말한다. 다만 Software 2.0의 도입으로 인해 유저가 말한 "키워드"뿐만 아니라 이 유저의 평소 행동까지 같이 고려하여 "상품"을 말하게 된다. SNS에서도 여전히 서비스는 "피드"를 말하지만 Software 2.0의 도입으로 인해 유저의 평소 행동을 바탕으로 더욱 관심있어할 "피드"를 말하게 된다.

Software 3.0에서는 키워드 검색을 하지 않는다. 유저는 다른 사람에게 말하듯 자신의 의도를 자연스럽게 표현한다. "핸드크림" 키워드를 검색하는 것이 아닌 "손이 건조해" 라고 본인의 의도를 표현하게 된다. Software 2.0에서는 키워드 검색을 해야 하기에 "구글링"이라는 워딩이 존재했지만 이젠 더 이상 필요하지 않다. 자연스럽게 내 의도를 작성하기만 하면 된다. 결국 유저가 "의도"를 말할 때 서비스는 "상품"을 말한다.

소프트웨어의 버전 상승에 따라 행동 방식 자체가 바뀌지는 않는다. 다만 훨씬 더 유저의 의도를 쉽게 파악할 수 있게 된다.

Chat Interface

이런 생각들을 가지고 다음 생각으로 이어져보자.

현재 LLM이 등장하고 나오는 대부분의 서비스들은 채팅 인터페이스를 갖고 있다. "대화"라는 것에 갇혀 있다고 볼 수 있다. 하지만 위에서 봤듯이 "대화"라는 것은 실제 conversation, dialogue의 형태가 아니어도 충분히 이뤄질 수 있다. 사람들 간의 대화도 텍스트 형태로만 이뤄지는 것이 아니라 표정이나 바디 랭귀지로도 대화가 가능하기 때문이다. Software 3.0의 핵심은 "지능"이며 인간의 사고 추상화가 가능한 것이다. 대화가 가능한 것이 핵심이라고 말하기엔 지금까지 우리의 모든 소프트웨어가 대화였다고 볼 수 있기 때문이다.

결국 다음 프로덕트를 만들기 위해서는 대화의 틀, 채팅 인터페이스를 벗어나야 하며 Software 3.0의 핵심에 본질적으로 더 집중해야 할 필요가 있다.

Next UX

현재 웹이 대표적인 프로덕트 인터페이스 형태이므로 웹을 중점적으로 생각해보자.

웹 인터페이스와 채팅 인터페이스가 분리되어서는 안된다. 하나의 인터페이스인 것처럼 긴밀하게 합쳐져야 한다. 유저의 의도를 명시적으로 받아들일 수 있는 채팅 인터페이스와 유저의 의도를 암시적으로 받아들일 수 있는 웹 인터페이스 2가지 경로를 토대로 유저의 의도를 분석해야 하며 Software의 아웃풋 또한 소프트웨어의 의도를 텍스트 형태로 전달할 수 있는 채팅 인터페이스와 소프트웨어의 의도를 실제 유저가 사용하고 있는 공간에서 전달할 수 있는 웹 인터페이스 모두를 사용할 수 있어야 한다.

그 과정 속에서 다음과 같은 질문을 스스로 던질 수 있어야 한다.

  1. 웹 인터페이스에서 사람의 "사고"를 대체할 수 있는 것이 없을까?
  2. 웹에서 내 목표를 이루기 위한 명령 횟수가 더 줄어들 수는 없을까?
  3. 내 목표를 이루기 위한 이해나 행동을 더욱 추상화시켜줄 수 없을까?

나는 크게 4가지 카테고리로 분류해보았다.

  1. 웹 이해 (read) -> 채팅; 페이지 컨텐츠 기반 Q&A
  2. 웹 행동 (write) -> 채팅; 사용자 의도 파악
    • 사용자가 헤매고 있을 때 먼저 말 걸어주기. 무언가를 찾고 있을 때 도와주기.
    • 하지만 아무 때나 말 걸면 안됨.
  3. 채팅 -> 웹 이해 (read); Next Browser
    • 대화를 토대로 웹 이해를 도울 수 있도록 웹 재구성. 같은 서비스이지만 초개인화된 웹뷰.
  4. 채팅 -> 웹 행동 (write); Browsing (Autonomous Web Navigation)
    • 채팅을 토대로 웹에서의 행동으로 전환시켜주는 것. 내가 원하는 정보가 있을 때 그 정보가 있는 곳으로 옮겨주는 것.

여기에서 1, 2, 3, 4를 모두 이어본다면 어떨까? 또한 채팅 인터페이스를 생략한다면 어떨까?

웹 이해, 웹 행동 -> 채팅 -> 웹 이해, 웹 행동

결국 다음과 같이 정리할 수 있다.

페이지 컨텐츠를 분석하고 (웹 -> 소프트웨어)
그 위에서의 사용자 행동을 토대로 사용자의 의도를 파악하고 (유저 -> 소프트웨어)
원하는 형태로 컨텐츠 재구성하며 (소프트웨어 -> 웹)
사용자 행동을 도움 및 제안할 수 있을 것이다. (소프트웨어 -> 유저)

채팅 인터페이스가 없어졌지만 여전히 대화의 형태가 남아있으며 Software 3.0으로 인한 혁신이 가능해진다. 이는 특정 도메인의 소프트웨어에만 적용 가능한 내용이 아니며 모든 도메인에서 가능하다.

이것이 바로 다음 세대의 초개인화가 될 것이다. 현재 불리는 초개인화는 유저의 행동들을 타뷸라 형태로 바꿔서 그것만으로 학습하는 것뿐이다.

소프트웨어의 인풋이 상품과 그에 따른 유저의 행동이라는 것은 똑같지만 더욱 다양한 형태의 인풋이 가능해짐으로써 고도화된 분석이 가능해졌고, 소프트웨어의 아웃풋이 단순히 타뷸라 형태가 아닌 웹 모달리티, 사용자 행동의 형태로 나타나게 될 것이다.

이렇게 보았을 때도 여전히 채팅 인터페이스가 중요할까? 채팅 인터페이스는 유저의 의도와 소프트웨어의 의도를 전달하는 방식 중 하나일 뿐이다. 서비스의 본질은 유저에게 도움이 되기 위함이다. 유저가 텍스트로 의도를 전달하는 것이 귀찮고, 텍스트로 소프트웨어의 의도를 전달받는 것이 귀찮다면 또한 훨씬 더 효율적인 방식이 있다면 그를 택하지 않을 이유가 없다.

Conclusion

  1. 모든 소프트웨어는 "대화"의 형태를 갖고 있으며 LLM만의 특징이지 않다.
  2. LLM의 본질은 "사고의 추상화"이다. "대화"가 아니라.
  3. "채팅 인터페이스"는 없어져야 한다.
  4. 기존 프로덕트 공간인 "웹", "앱" 모달리티사용자 행동에 더욱 집중하자.