Logo ko.androidermagazine.com
Logo ko.androidermagazine.com

Google 듀플렉스 란 무엇입니까?

차례:

Anonim

Google I / O 2018에서 Google의 최신 최신 멋진 Duplex 데모를 보았습니다. 60 피트 화면의 어시스턴트는 어시스턴트가 미용사에게 전화를 걸고 약속을 설정하고 일시 중지, 음소거 및 아아, 그리고 인간의 말에 수반되는 다른 특질들. 약속을 잡은 사람은 컴퓨터처럼 들리지 않기 때문에 컴퓨터와 대화하고 있다는 것을 알지 못하는 것 같습니다. 조금도 아닙니다.

그런 종류의 데모는 놀랍고 (아마도 약간 소름 끼치지만) 세부 사항은 어떻습니까? 듀플렉스 란 무엇입니까? 어떻게 작동합니까? 우리는 이러한 다른 점을 볼 때 질문이 있으며 인터넷을 통해 답을 찾는 것은 고통 스럽습니다. Google Duplex에 대해 지금까지 알고있는 내용을 살펴 보겠습니다.

Google Duplex 란 무엇입니까?

Google의 AI 연구원 및 개발자에 따르면 인공 지능 (AI)을 사용하여 "전화를 통해 실제 작업을 수행"하는 것을 목표로하는 Google의 새로운 도구입니다. 현재로서는 약속을 잡는 것과 같은 매우 구체적인 작업을 의미하지만 다른 영역으로의 확장을 염두에두고 기술이 개발되고 있습니다. 저녁 식사 예약을위한 멋진 방법을 만들기 위해 수십억 달러를 지출하는 것은 Google이하는 것처럼 들리지만 시간이나 돈을 많이 사용하지는 않습니다.

듀플렉스는 또한 데모에서 보았던 것 이상이며 실험실을 떠나면 실험실은 우리가 보거나 듣는 것보다 훨씬 더 많은 것입니다. 최종 결과만큼 시원하지 않은 엄청난 양의 데이터 뱅크와 처리 할 컴퓨터가 있습니다. 그러나 컴퓨터와 대화하고 실시간으로 사람처럼 생각하기가 어렵 기 때문에 필수적입니다.

이것은 말투 텍스트와 같지 않습니까?

아니. 근처에도 안. 이것이 큰 문제입니다.

듀플렉스는 컴퓨터가 전화에서 "통화"하는 방식을 변경하도록 설계되었습니다.

듀플렉스의 목표는 사물을 자연스럽게 만들고 보조자가 작동하는 약속 시간을 찾기 위해 즉석에서 생각하는 것입니다. Joe가 "그렇습니다. 10 시까지는 아무것도 열지 않습니다. 괜찮습니까?"라고 말합니다. 조수는 Joe의 말을 이해하고 그 의미를 파악한 후 Joe가 제공하는 것이 당신에게 도움이 될지 생각해야합니다. 10시에 시내를 가로 질러 바쁘고 Joe 's Garage까지 자동차로 40 분이 걸리는 경우, Assistant는이를 파악하고 11:15가 좋을 것이라고 말할 수 있어야합니다.

Google에도 마찬가지로 중요한 것은 Duplex가 사람처럼 대답하고 소리를 듣는 것입니다. 구글은 전화로 상대방이 컴퓨터와 대화하고 있다는 것을 알지 않기를 원했지만 결국 그들에게 알리는 것이 최선이라고 결정했다. 사람들과 대화 할 때는 전화로 전화를 걸거나 DMV의 컴퓨터에서 비서와 대화 할 때보 다 더 빠르고 덜 공식적인 대화 (읽기: 컴퓨터의 관점에서 비 일관적인 덤블링)를합니다. 듀플렉스는 이해해야합니다. 답장을 할 때 다시 작성하십시오.

마지막으로 가장 인상적인 것은 듀플렉스가 상황을 이해해야한다는 것입니다. 금요일, 다음 금요일 및 다음 주 금요일 은 모두 귀하와 본인이 이해하는 용어입니다. 듀플렉스도 그것들을 이해해야합니다. 우리가 입력하는 것과 같은 방식으로 이야기한다면 이것은 문제가되지 않을 것입니다. 그러나 우리는 그것이 너무 답답한 소리로 들리기 때문에 그렇습니다. 예, 우리가 평생 듣고 들었을 때 혼란스럽지 않습니다. 아니, 우리는 당신이 그것을 이해하거나 그와 비슷한 것을 아는 문제가 없습니다.

큰 소리로 말하면서 입력 한 후 편집자에게 응급 처치를 해줄 것이므로 이것이 무엇을 의미하는지 알 수 있습니다.

듀플렉스는 어떻게 작동합니까?

사용자 측에서 Assistant에게 무언가를하도록 지시하는 것만 큼 간단합니다. 지금까지 언급 한 바와 같이 약속을하는 것에 만 제한이 있기 때문에 "저희는 화요일 아침 Joe 's Garage에서 오일 교환 약속을하겠습니다." Joe 's Garage를 설정하고 설정 한 다음 캘린더에 추가하십시오.

지속적인 대화는 Duplex와 동일한 기본 기술을 사용합니다.

꽤 근사하다. 그러나 카메라에서 발생하는 일은 훨씬 더 훌륭합니다.

듀플렉스는 소위 재발 신경망을 사용하고 있습니다. Google의 TensorFlow Extended 기술을 사용하여 구축되었습니다. Google은 음성 인식 소프트웨어를 혼합하여 선택하고 대화 시간 및 시간과 위치와 같은 세부 정보를 고려할 수있는 기능을 통해 동의 한 모든 익명화 된 음성 메일 및 Google 보이스 대화에 대해 네트워크를 교육했습니다. 양 당사자의.

기본적으로, 고성능 컴퓨터의 전체 네트워크는 클라우드에서 데이터를 처리하고 전화기의 Assistant 또는 Assistant가 탑재 된 기타 제품을 통해 대화합니다.

보안 및 개인 정보는 어떻습니까?

한 가지 간단한 것이 있습니다. Google을 신뢰하십니까? 온 디바이스 머신 인텔리전스는 제약이 있고 상대적으로 새롭지 만 실제입니다. Google은 개발자가 기기 자체에서 더 많은 작업을 수행 할 수 있도록 ML Kit를 개발했지만 모두 컴퓨팅 성능의 문제입니다. 이런 식으로 머리 약속을하기 위해서는 엄청난 양의 계산이 필요하며 휴대 전화 나 Google Home에서 할 수있는 방법은 없습니다.

스마트 제품을 사용하려면 데이터로 Google을 신뢰해야하며 Duplex도 마찬가지입니다.

어시스턴트가 지금 할 수있는 특별한 일을하기 위해 Google은 많은 개인 데이터를 활용해야하지만 듀플렉스는이를 변경하지 않습니다. 새로운 소식은 이제 대화를들을 수있는 권한을 Google에 명시 적으로 부여하지 않은 다른 당사자가 있다는 것입니다.

Duplex가 누구나 사용할 수있는 실제 소비자 제품이되면 법정에서 비판과 도전을받을 것으로 기대하십시오. 그리고 그것은 있어야합니다; Google이 개인 정보 보호에 가장 적합한 것을 결정하도록하는 것은 두 여우의 오래된 속임수와 저녁 식사를 결정하는 닭과 같습니다.

휴대폰에서 언제 Duplex를 사용할 수 있습니까?

올해 후반에 Assistant에 큰 변화가있을 것으로 예상됩니다.

지금은 아무도 모른다. 절대 일어날 수 없습니다. 구글은 이런 종류의 환상적인 일을 할 수있을 때 흥분하고 세상과 공유하고 싶어합니다. 그렇다고 그것이 성공하거나 실제 제품이되는 것은 아닙니다.

현재 Duplex는 폐쇄적이고 감독되는 환경에서 테스트되고 있습니다. 모든 것이 잘된다면, 소비자는 식당 예약을하고 미용실 예약을 예약하고 전화로 휴가 시간을 갖기 위해 소비자들에게 초기 시험 출시가 올해 말에는 전화 지원 만 사용됩니다.

어디서 더 배울 수 있습니까?

구글은 놀랍게도 듀플렉스를 만드는 데 사용하는 기술에 대해 개방적이다. 다음 웹 사이트에서 관련 정보를 찾을 수 있습니다.

  • Google AI 블로그 (Google)
  • 딥 마인드
  • Tensorflow.org
  • 코넬 대학 도서관
  • Google 리서치 (Google)
  • 키워드 (Google)
  • ML 키트 (Google)

물론, 우리는 또한 듀플렉스를 면밀히 따르고 있으며 가능한 한 빨리 최신 개발 내용을들을 수 있습니다.