Ngân Hàng Đột Phá - Chương 08

Chương 8

Trải nghiệm ngân hàng trong thời đại công nghệ mô phỏng con người

Trước đây, những công nghệ mà chúng ta sử dụng hằng ngày như công nghệ trả lời tự động thông qua nhận diện giọng nói (IVR – viết tắt của Interactive Voice Response), đường dây nóng, các trang web và thậm chí là các ứng dụng di động đều khá rườm rà. Trên phương diện trải nghiệm dịch vụ, giả sử bạn cần dùng một trong chúng, ví dụ như hệ thống trả lời tự động IVR, bạn phải gọi điện đến tổng đài, sau đó trải qua hàng loạt các bước trong hệ thống IVR mà nghe qua cứ như mô hình tổ chức, vô cùng phức tạp và rất khó xác định được bước kế tiếp.

Tuy vậy, ngày nay, các công nghệ tân tiến đã trở nên gọn nhẹ và dễ sử dụng hơn nhiều. Việc sử dụng đã được đơn giản hóa đến mức một đứa trẻ 18 tháng tuổi cũng có thể cầm iPad và tự biết cách dùng. Nhưng đừng để sự đơn giản đó đánh lừa bạn.

Ngày nay khả năng xử lý của một chiếc iPad đã tương đương với khả năng của Siêu máy tính vào năm 1993(1), có thể xử lý gần 80 gigaflops. Con chip Apple A7 64 bit được sử dụng trong điện thoại iPhone 5S và iPad Air thực chất là một CPU 1,4 GHz lõi kép, có nghĩa là mạnh hơn 1,4 triệu lần so với bộ vi xử lý 1 kHz dùng trong CPU của máy chủ trên tàu con thoi Apollo 11 – đúng thế đấy, chiếc điện thoại iPhone của bạn mạnh hơn 1 triệu lần so với chiếc máy tính đã mang Neil Armstrong, Buzz Aldrin và Micheal Collins lên mặt trăng. Ngay cả con trai tôi, từ hồi mới 10 tuổi nó đã hỏi tôi: “Bố ơi, thế sao chúng ta không tạo ra một ứng dụng đưa người lên mặt trăng nhỉ?”. Và đó chưa phải là tất cả.

1 Đây là Siêu máy tính năm 1993 của hãng Fujitsu (Nhật Bản). Nó có khả năng tạo ra 100 Gflops/giây khi sử dụng cùng lúc 140 con chíp CPU (lõi CPU thời bấy giờ), trong khi ngày nay iPad Air có khả năng tạo ra 78,6 Gflops/giây với duy nhất 1 con chíp hai lõi A7.

Khả năng xử lý ưu việt của máy vi tính đã dẫn đến sự gia tăng băng thông khổng lồ, và đương nhiên là sự lan rộng của mạng Internet và các nội dung có liên quan. Eric Schmidt từng nói một câu mà nay rất hay được trích dẫn lại, đại ý từ lúc bình minh của nhân loại cho đến năm 2003, chúng ta tạo ra khoảng 5 exabytes nội dung, trong khi hiện tại, chỉ cần vài ngày là đã sản sinh được khối lượng nội dung tương tự. Kể từ khi Schmidt đưa ra nhận định này, chúng ta vẫn tiếp tục chứng kiến mức gia tăng phi mã về khối lượng dữ liệu và nội dung trên nền tảng IP.

Một vài nhà khoa học ước tính rằng trong năm 2013, con người sẽ sản sinh ra gần 4 zettabytes(2) nội dung. Để dễ hình dung hơn, khối lượng thông tin này tương đương với bộ nhớ của 250 tỉ chiếc điện thoại iPhone – thậm chí có thể còn nhiều hơn khối lượng dữ liệu mà Cục tình báo Hoa Kỳ NSA (National Sucurity Agency) lưu trữ trong các trung tâm bí mật của mình. Tuy vậy, vẫn có cách tốt hơn để minh họa cho sự bùng nổ của dữ liệu, nội dung và thông tin. Mỗi năm có 4 zettabytes nội dung được sản sinh, có nghĩa là cứ mỗi giây, chúng ta sản sinh ra lượng thông tin tương đương với 100.000 lần nội dung của tất cả các cuốn sách, tạp chí và báo từng được xuất bản trong suốt lịch sử nhân loại. Phần lớn các nội dung đó được sản sinh trong môi trường trực tuyến – các đoạn video, nhạc, hình ảnh số từ điện thoại thông minh. Số lượng thông tin này thật đồ sộ.

2 1 zettabyte bằng 1 triệu exabytes.

Đó là lúc thiết kế trở thành vấn đề thiết yếu. Dù là thiết kế kiểu dáng tinh tế của một chiếc điện thoại hay máy tính bảng, hay bỏ ra hàng trăm ngàn giờ đồng hồ làm việc để thiết kế phần mềm giao diện đứng sau các trò chơi điện tử, để thiết kế nên sự thông minh của các cảm biến và ứng dụng trong các thiết bị đeo tay như đồng hồ theo dõi tập luyện thể thao và các ứng dụng đi kèm, hoặc khả năng thực hiện ngân hàng trực tuyến trên điện thoại di động – thiết kế giúp chúng ta lọc thông tin khổng lồ từ máy tính, từ kho nội dung số bao la, và từ đó mang đến cho chúng khía cạnh nhân văn, giúp người dùng có thể trải nghiệm ứng dụng thông qua bối cảnh cụ thể.

THIẾT KẾ VÀ SỨC MẠNH CỦA MÁY TÍNH ĐÃ LÀM THAY ĐỔI VAI TRÒ CỦA CÔNG NGHỆ NHƯ THẾ NÀO?

Hãy nghĩ đến công nghệ đằng sau một chiếc máy ATM chẳng hạn, ban đầu nó khá đơn giản và thuần túy ứng dụng. Hiện nay, màn hình cảm ứng đã được cải tiến, có chức năng nhận diện giọng nói, nhận diện sinh trắc học, và những điều này đã khiến việc sử dụng điện thoại hay ATM trở nên tiện dụng hơn rất nhiều.

Phó tổng giám đốc phụ trách thiết kế tại Apple, Jonathan Ive là một trong những chuyên viên thiết kế có sức ảnh hưởng mạnh mẽ nhất và được nhiều người biết đến nhất trên toàn thế giới trong thế hệ của mình. Từ khi bước chân vào Apple vào năm 1992, ông đã lãnh đạo quá trình phát triển của nhiều sản phẩm đột phá như iMac, PowerBook G4, iBook, máy nghe nhạc iPod, iPhone và iPad. Cái tên Jonny Ive trở thành cái tên thân thuộc với mọi người đã nói lên tầm ảnh hưởng của thiết kế đối với công nghệ ngày nay.

Công nghệ đã không còn thuần túy mang tính ứng dụng được nữa; ngày nay công nghệ cần phải đẹp đẽ và có khả năng tương tác. Các sản phẩm công nghệ khi cầm trên tay phải cho cảm giác dễ chịu, sử dụng trực quan, trình bày rõ ràng, có khả năng cảm biến đa điểm, và thậm chí phải kết hợp cả chức năng bảo mật và nhân trắc học. Ngày xưa, điều quan trọng nhất là khả năng xử lý. Những nhà sản xuất máy tính đã từng quảng bá những dòng máy mới dựa vào việc nâng cấp CPU – hãy mua chiếc máy tính này có bộ xử lý Pentium mới, nhanh gấp đôi máy tính cũ của bạn!

Nhưng ngày nay, các hãng như Samsung, Apple, HTC và Microsoft đã sử dụng khía cạnh con người trong công nghệ – ví dụ như việc ghi lại các đoạn video quảng cáo, có cảnh một người có thể cầm bằng một tay chiếc máy tính bảng nhẹ bỗng, mỏng hơn cả chiếc bút chì, với màn hình có mức độ hiển thị màu sắc tốt đến mức mắt thường không thể nhận ra bất cứ điểm nhòe nào. Chúng ta đã bước vào giai đoạn công nghệ giúp cải thiện cuộc sống con người và giảm thiểu trở ngại trong cuộc sống. Chúng ta không cần phải học ngôn ngữ DOS hay cú pháp các dòng lệnh. Chúng ta không cần phải đưa đĩa mềm chứa phần mềm vào máy tính, cũng không cần dùng đến đĩa CD-ROM hay DVD nữa, chúng ta có thể tải tất cả những thứ mình muốn từ Internet. Thiết kế của các phần mềm đã được cải thiện theo thời gian, khiến nó trở nên dễ dàng, đơn giản và dễ sử dụng hơn.

Giao diện người dùng sẽ thay đổi như thế nào trong 10 năm tới? Hãy nghĩ đến những bước tiến chúng ta đã thực hiện được từ Windows 3.11 cho đến iOS 7. Hãy nghĩ đến các bước cải thiện căn bản từ chiếc máy tính Compaq đầu tiên cho đến máy tính bảng chúng ta đang dùng ngày nay. Hãy nghĩ đến hàng loạt những ứng dụng di động mà chúng ta sử dụng mỗi ngày, và tất cả những ứng dụng này không hề tồn tại tính đến 6 năm trở lại đây. Hãy nghĩ đến việc hiện nay chúng ta có thể nói chuyện với xe hơi của mình, điều khiển máy điều hòa tại nhà từ xa bằng điện thoại di động, mở khóa cửa nhà, hoặc thậm chí là đo nhịp tim của mình bằng một phụ kiện của iPhone.

Liệu có đến lúc nào đó mà những công nghệ này sẽ trở nên tốt đến mức chúng có thể mô phỏng gần giống với phản ứng của con người? Liệu chúng có khả năng một ngày nào đó thay thế những người phục vụ thật sự trong một vài tình huống tương tác mỗi ngày? Đó cũng chính là câu hỏi tôi đã đặt ra cho bốn chuyên gia toàn cầu trong lĩnh vực cải tiến công nghệ đối với lĩnh vực dịch vụ trong ngành dịch vụ tài chính.

Tôi đã phỏng vấn Sankar Krishnan – chuyên viên quan hệ khách hàng toàn cầu của Sutherland Global Services, Bjorn Hildahl – phó chủ tịch quản lý sản phẩm tại Kony Solutions, Andy Mauro và Robert Weideman từ Nuance Communications. Chúng tôi sẽ trao đổi về công nghệ, lĩnh vực ngày càng cung cấp nhiều tính năng hơn, nhẹ nhàng hơn và trực quan hơn, và đang bắt đầu cạnh tranh với con người trong lĩnh vực dịch vụ. Dưới đây là một số điểm chính ngắn gọn từ cuộc trò chuyện này.

Brett: Sankar, đối với một trải nghiệm dịch vụ thông thường khi tôi gọi đến hệ thống IVR của một ngân hàng nào đó, những chiến thuật gì có thể được áp dụng để cải thiện dịch vụ của các tổ chức này? Liệu tôi sẽ được lợi gì khi sử dụng hệ thống IVR tự động? Chúng ta thường nghe người khác nói, “Tôi chỉ muốn nói chuyện với một con người, người có thể giải quyết vấn đề của tôi”. Làm thế nào chúng ta có thể san bằng khoảng cách này bằng công nghệ?

Sankar: Hiện nay, có nhiều nỗ lực vì mọi người luôn tự đặt ra câu hỏi, “Làm thế nào để đơn giản hóa điều này? Làm thế nào để giọng nói trở thành mật khẩu? Làm thế nào để tin nhắn hoặc công cụ nhắn tin mà chúng ta sử dụng trên điện thoại di động có thể giúp người tiêu dùng đối thoại trực tiếp với một người có thể giải quyết vấn đề của họ?”. Đây là một cách tiếp cận mới mẻ đối với ngành ngân hàng, và rất nhiều ngân hàng hiện nay đã học hỏi được từ ngành bán lẻ hoặc ngành hàng không. Bây giờ, khi bạn gọi đến nhiều ngân hàng quốc tế, bạn có thể sử dụng giọng nói của mình như mật khẩu, như thế bạn có thể nói chuyện được với hệ thống. Đến lần thứ hai bạn gọi, hệ thống sẽ cho phép bạn đi thẳng đến nguyên nhân của vấn đề vì có rất nhiều phân tích đã được tích hợp vào ngay khi chúng ta cất tiếng nói. Khi cuộc gọi của tôi được tiếp nhận, ngân hàng sẽ biết được chính là tôi, Sankar, đang gọi điện đến, và hệ thống sẽ tự động nói rằng tôi có 2 chiếc thẻ, 2 khoản vay ngân hàng, và một tài khoản tiền gửi.

Dựa vào lịch sử các cuộc gọi đến của tôi, hệ thống cũng có khả năng học hỏi và đưa tôi trực tiếp đến các câu hỏi mà nhiều khả năng tôi sẽ hỏi, nhờ vậy sẽ giải quyết được vấn đề của tôi một cách nhanh chóng nhất. Tất cả cấu trúc đường dẫn của IVR mà anh đã nhắc đến, để được tiếp xúc với chuyên viên hoặc tư vấn, đều bị loại bỏ.

Brett: Đối với những khoản đầu tư mà Sutherland Global đang thực hiện, các anh đang đầu tư vào những gì trong lĩnh vực công nghệ và nền tảng để có thể giúp các ngân hàng xây dựng những nền tảng này cho người dùng?

Sankar: Đầu tiên, chúng tôi nghiên cứu tất cả các quy trình hiện nay và tìm cách thiết kế lại phần lớn trong số đó. Hãy lấy ví dụ quy trình phân phối tài sản. Bây giờ, khi xem xét đến sự dịch chuyển của khách hàng, sự phát triển của AUM(3), cùng với tất cả những diễn biến xảy ra đối với phân khúc thị trường này, Sutherland cần phải sắp xếp lại những quy trình này theo cách nào để các bộ phận hỗ trợ có thể tận dụng được tối đa ưu thế công nghệ? Chúng tôi đang làm công tác thiết kế lại trước. Sau khi các bộ phận hỗ trợ phía sau đã được hoàn thiện, chúng tôi sẽ tiếp tục ứng dụng các công nghệ tốt nhất cho việc nhắn tin và tương tác.

3 AUM: tài sản đang được quản lý.

Đối với mô hình cũ thì, “Một trăm nhân viên Ấn Độ sẽ tốt hơn, rẻ hơn và nhanh hơn so với một trăm nhân viên ở Hoa Kỳ.” Nhưng hiện nay chúng tôi sẽ nói, “Này, với công nghệ này, chúng ta chẳng cần gì tới 100 nhân viên cả. Chúng ta sẽ làm được công việc tương tự chỉ với 50 người hoặc thậm chí là 20 người – ít hơn nhiều”. Nhưng chúng tôi cũng ứng dụng rất nhiều công nghệ chuyển hướng cuộc gọi tự động, rất nhiều công nghệ nhận dạng giọng nói của Nuance, và chúng tôi đang đưa những công nghệ này vào vị trí then chốt trong số những việc đang làm. Chúng tôi đang đầu tư rất nhiều vào công nghệ nhắn tin IP, nền tảng thông báo trên điện thoại di động và công nghệ nhắn tin SMS, nhờ đó nếu một khách hàng chỉ cần ngồi với điện thoại trên tay, đang có thời gian rảnh rỗi ngồi trên taxi hay tàu điện ngầm chẳng hạn, họ vẫn có thể kết nối với ngân hàng và giải quyết được vấn đề.

Brett: Giờ thì đến Bjorn Hildahl của Kony Mobile Solutions. Anh có nhận định gì về vấn đề đưa ra những giải pháp di động tốc độ cao hơn, sử dụng nền tảng phát triển ứng dụng di động (hay còn gọi là MDAP)? Và Kony đang làm gì trong việc thúc đẩy sự phát triển và tăng cường khả năng tiếp cận người dùng của các công nghệ ngân hàng trực tuyến?

Bjorn: Tại Kony, chúng tôi đã tạo dựng nên một nền tảng kết nối nhiều kênh. Đối với các tổ chức như một ngân hàng nằm trong danh sách Fortune 500, từ một dòng lệnh anh có thể triển khai nhiều hoạt động trên điện thoại, máy tính bảng và máy tính bàn, nhưng anh cũng có thể khiến mỗi trải nghiệm trở nên riêng biệt trên từng kênh để tăng tính tương tác với người tiêu dùng theo đúng cách họ mong muốn. Ứng dụng trên di động sẽ mang lại trải nghiệm đúng với một ứng dụng di động, ứng dụng trên máy tính bảng sẽ giống ứng dụng trên máy tính bảng, và trang web sử dụng trên máy tính sẽ cho cảm giác nó được thiết kế dành cho mục đích này. Việc chúng tôi đang tập trung làm trong ngành ngân hàng chính là phá vỡ cái gọi là chuẩn mực hoàn hảo đang tồn tại, khi các ngân hàng có một kênh trực tuyến riêng, một nhóm làm việc trên di động riêng, và tất cả vận hành trên các câu lệnh khác nhau hoặc dựa vào các công nghệ khác nhau để đưa về một hệ thống chính. Chúng tôi đang cố gắng tạo ra những nền tảng có khả năng hỗ trợ việc quản lý chiến lược, thu hút người dùng mới, thân thiện với người dùng, có thể đưa ra thông báo, tương tác với người dùng bằng các phương pháp mới, nhờ đó (trên cương vị người tiêu dùng) anh sẽ không bị bỏ rơi khi anh đi từ việc sử dụng ngân hàng trực tuyến đến việc gặp chuyên viên ngân hàng, hoặc từ việc sử dụng ứng dụng ngân hàng di động đến việc gọi đến tổng đài. Vì càng ngày càng có ít khách hàng tìm đến với các chi nhánh ngân hàng, chúng ta đang cần nhiều phương pháp hơn để tương tác với ngân hàng, chuyển sang di động và các kênh khác, cũng như tìm cách tận dụng những kênh này để mang các chức năng đang hiện hữu đối với một chuyên viên hoặc một tư vấn viên chẳng hạn, lên nền tảng trực tuyến hoặc di động.

Brett: Là một người chủ yếu dùng di động (tôi mang điện thoại theo người ở khắp mọi nơi, tôi dùng nó để check-in cho các chuyến bay, tôi kiểm tra email, tôi đặt món ăn, tôi đặt vé xem phim), liệu có kỳ vọng nào lớn hơn đối với dịch vụ ngân hàng trong việc giải quyết một số vấn đề của mình qua điện thoại thông minh, thay vì phải gọi một người nào đó hoặc trực tiếp đến chi nhánh, hay không?

Bjorn: Hẳn nhiên là có. Hiện nay, ai trong chúng ta cũng đều có điện thoại di động và máy tính bảng. Chúng hoạt động liên tục, còn chúng ta thì đang phải chịu sự quá tải thông tin. Có quá nhiều thứ khiến chúng ta mất tập trung, cho dù đó là trò chơi Angry Birds, một thông báo từ Amazon hay eBay, hoặc thứ gì khác. Do đó, khi tôi động vào, và thật sự sử dụng điện thoại cho các hoạt động ngân hàng, thì các thao tác phải thật nhanh và thật dễ dàng. Điều cần làm là phải mang lại trải nghiệm tuyệt vời, cho phép khách hàng tiếp cận, thử và làm những gì họ muốn.

Sau đây là một ví dụ tiêu biểu. Gần đây tôi vừa thử nhập một vài tài khoản ngân hàng của vợ chồng tôi lại với nhau, nhưng tôi không thể làm điều này trực tuyến. Tôi phải sắp xếp một cuộc hẹn với ngân hàng, nhưng cách duy nhất để xếp lịch hẹn là thông qua hệ thống đặt lịch trực tuyến, chứ không phải thông qua điện thoại di động. Có quá nhiều điểm khiến tôi muốn bỏ cuộc trong suốt quá trình trải nghiệm dịch vụ này, đến mức tôi tự hỏi “Liệu mình có muốn tiếp tục sử dụng ngân hàng này nữa hay không?”.

Brett: Anh có cho rằng các tổ chức đang hoạt động tốt trên nền tảng di động sẽ có được danh tiếng thương hiệu tốt hơn?

Bjorn: Đương nhiên rồi, vì rõ ràng là ngày nay khi anh nghĩ về điều này, có cả một thế hệ coi di động là hàng đầu. Họ sẽ không dùng máy tính hay mạng Internet. Kênh tiếp xúc quan trọng nhất với họ là điện thoại di động. Hiện nay, phần lớn các ứng dụng ngân hàng di động đều thiên về việc đưa trải nghiệm ngân hàng trực tuyến sang thiết bị di động, cố gắng điều chỉnh để “ép” ngân hàng di động cho vừa vào một màn hình bé hơn. Nhưng tôi vẫn nghĩ chúng ta đang ở phần ngọn của tảng băng với các công nghệ như Nuance hay Siri. Còn có một số công nghệ khác như Mitec và các công nghệ sử dụng nhận diện hình ảnh, tận dụng camera, và đồng thời còn có các công nghệ không gian địa lý. Khi tôi bước chân vào ngân hàng, làm thế nào mà ứng dụng di động có thể biết được tôi vừa bước chân vào chi nhánh? Khi đó ứng dụng có thể đưa ra cho tôi một mã QR code(4) hoặc một tin nhắn mà tôi có thể đưa ra cho nhân viên ngân hàng hoặc chuyên viên chăm sóc khách hàng, để họ biết ngay tôi là ai. Không cần phải quẹt thẻ, chỉ đơn giản là khiến trải nghiệm được cá nhân hóa cao độ và khiến mọi thứ dễ dàng hơn đối với tôi.

4 QR code: viết tắt của Quick Response Code (tạm dịch là mã phản hồi nhanh) hay còn gọi là mã vạch ma trận (matrix-barcode) là dạng mã vạch hai chiều (2D) có thể được đọc bởi một máy đọc mã vạch hay điện thoại thông minh có chức năng chụp ảnh với ứng dụng chuyên biệt để quét mã vạch.

Brett: Bjorn, các thông báo trên di động chỉ hoạt động tốt nếu có dữ liệu về tình huống và khả năng phản ứng tức thời. Làm thế nào ngân hàng có thể cải thiện quá trình này? Một tổ chức cần làm gì đối với hệ thống xử lý để có thể tận dụng toàn bộ ưu điểm của công nghệ di động theo cách mà anh đang bàn?

Bjorn: Tại Kony, chúng tôi có một bộ máy quản lý dịch vụ tuyệt vời cho phép người dùng kết nối để kết hợp với nhiều nguồn dữ liệu khác nhau. Từ ứng dụng di động có vẻ như chỉ là một điểm dịch vụ, nhưng tôi có thể kết nối với các cuộc gọi và lấy được dữ liệu từ dịch vụ của bên thứ ba, từ thông tin vị trí địa lý, từ một hệ thống trung tâm; tất cả những thứ này được kết hợp nhuần nhuyễn để tạo nên một hệ thống tổng đài hoặc trải nghiệm trên ứng dụng. Điều bạn muốn làm được chính là nhìn vào đó, và nói, “Mục tiêu của trải nghiệm trên ứng dụng này là gì?”, và sau đó là “Liệu tôi có thể có được dữ liệu này từ nguồn nào?”.

Một trong những hạn chế lớn nhất hiện nay luôn là vấn đề mà phần lớn chúng tôi đang tập trung giải quyết: Làm thế nào tôi suy ra được dữ liệu Internet từ các nền tảng cốt lõi của tôi?

Nhưng đây chỉ là một phần thôi. Khi tôi gọi đến tổng đài vì một giao dịch thẻ tín dụng, tôi có thể bấm nhầm thứ tự, hoặc có rất nhiều thứ có thể không chính xác. Chúng tôi đã xây dựng một nền tảng tốt và bắt mắt, cho phép anh kết hợp với các giao dịch tài chính của bên thứ ba, hoặc với các dịch vụ dữ liệu khác để hỗ trợ mang lại trải nghiệm tốt hơn cho người dùng.

Chúng tôi nhận thấy trong vòng 3 tháng kể từ khi sử dụng ứng dụng di động của chúng tôi, một số khách hàng đã giúp kéo theo khách hàng mới, làm tăng số người dùng lên hơn gấp đôi, tương đương với tạo ra dòng thu nhập mới.

– Bjorn Hildahl, Kony

Brett: Anh đánh giá thế nào về mức độ nhận biết trong nội bộ tổ chức về những vấn đề này trong ngành ngân hàng?

Bjorn: Cách đây hơn 10 năm, điện thoại di động chỉ là một hạng mục đầu tư “cho có”, và cần đầu tư vì người khác đã có. Nhưng giờ thì thiết bị này đã trở thành cách tiếp cận ưu tiên hàng đầu cho di động trong nhiều tổ chức, và hiện đã cạnh tranh về quy mô hoặc nỗ lực với các hoạt động ngân hàng trực tuyến. Còn nếu không, các ngân hàng cũng đang cố gắng nhập hai mảng vào làm một.

Về số lượng khách hàng, chúng tôi nhận thấy trong vòng 3 tháng kể từ khi sử dụng ứng dụng di động của chúng tôi, một số khách hàng đã giúp kéo theo khách hàng mới, làm tăng số người dùng lên hơn gấp đôi, tương đương với tạo ra dòng thu nhập mới. Đây thật sự là điều quan trọng đối với một ngân hàng! Nó không chỉ tạo ra trải nghiệm tuyệt vời cho người dùng, mà đồng thời còn mang lại lợi nhuận tốt từ việc tương tác với người dùng trong mảng dịch vụ ngân hàng và tài chính, từ việc mở tài khoản, gửi tiền tiết kiệm thông qua những công nghệ như thu nhận tiền gửi từ xa, hay mang lại các sản phẩm khiến cuộc sống của người tiêu dùng được nâng cao. Sau đó, việc này sẽ được nhân rộng ra toàn cầu.

Brett: Tôi đã phỏng vấn Neff Hudson ở USAA, người mà anh có thể cũng quen biết, và anh ta nói rằng họ đang thật sự hướng đến cách tiếp cận ưu tiên cho di động; càng ngày càng có nhiều khách hàng sử dụng di động hơn là các kênh khác. Nhưng khoảnh khắc mang ý nghĩ quyết định đối với họ là khi họ giới thiệu dịch vụ nhận tiền gửi từ xa thông qua ứng dụng – chỉ trong một thời gian ngắn đã có sự gia tăng đột biến, số người dùng sử dụng ngân hàng gia tăng rất nhanh, chủ yếu vì họ muốn sử dụng tính năng này. Những chức năng nào anh cho rằng là tối thiểu phải có trên di động?

Bjorn: Dĩ nhiên là bạn cần phải có trong tay các tài khoản của mình, thanh toán hóa đơn và khoản chia tài sản, hoặc bạn cần tìm một cây ATM hoặc đến một nơi để rút được tiền mặt,... Tất cả đều là những điều căn bản. Nhưng có một vài điều mà mọi người cần phải bắt đầu suy nghĩ, đó là một khi xây dựng trải nghiệm lấy điện thoại di động làm trung tâm sắp bắt đầu, còn khả năng quản lý tài khoản từ xa thông qua thiết bị di động thì ngày càng tốt hơn. Không chỉ là “chỉ được đọc”, mà còn là bảo đảm việc anh có thể xây dựng và sửa đổi nhiều thứ. Một điều quan trọng nữa anh cần nghĩ đến khi xây dựng chiến lược di động là quyền lợi. Hãy nghĩ từ góc nhìn của một gia đình. Nếu tôi muốn đưa tiền cho con gái tôi, tôi có thể làm việc này thông qua thiết bị di động, để con bé truy cập vào tài khoản trên di động, nhưng chỉ có thể nhìn thấy số dư trong một tài khoản trả trước mà tôi đã đăng ký cho con bé. Nếu tôi có thể khiến tất cả những việc này được thực hiện thông qua di động, con bé có thể đến và nói, “Bố ơi, con cần 20 đô để đi xem phim”, thì sẽ dễ dàng hơn cho tôi nếu tôi có thể chuyển khoản hoặc đưa số tiền này vào quỹ bảo đảm dành cho con bé ngay lúc đó. Điều này làm cuộc sống của tôi dễ dàng hơn, khiến mối quan hệ và sự tương tác với ngân hàng tốt lên vì hiện nay tôi đã sắp xếp được khá nhiều tương tác với ngân hàng theo cách đơn giản và dễ sử dụng.

LIỆU NHẬN DẠNG GIỌNG NÓI CÓ GIÚP CHÚNG TA GIẢI QUYẾT ĐƯỢC NHỮNG THÁCH THỨC TRONG NHẬN DẠNG VÀ CUNG CẤP DỊCH VỤ?

Tôi nghĩ sẽ là thiếu sót nếu không đi vào phân tích công nghệ nhận dạng giọng nói, cũng như những công nghệ như Siri mà chúng ta đã thấy xuất hiện thời gian gần đây trên các máy điện thoại iPhone và Android (Google Voice). Tôi đã mời Robert Weideman và Andy Mauro từ Nuance. Andy lãnh đạo dự án giải pháp Nina tại Nuance Communications. Nina được mệnh danh là “Siri trong ngành ngân hàng”, một nền tảng nhận dạng giọng nói được thiết kế chuyên biệt cho phép bạn đặt ra câu hỏi với ngân hàng của mình bằng cách đối thoại thông thường. Các ngân hàng như BBVA và Citi đã bắt đầu triển khai các giải pháp này cho việc xử lý 70-80% khối lượng các cuộc gọi đến tổng đài. Không chỉ vậy, những công cụ này còn đang được tích hợp vào ứng dụng di động và ngân hàng trực tuyến.

Brett: Andy, hãy cho chúng tôi biết xem những bước tiến nào đã và đang diễn ra trong công nghệ nhận diện giọng nói và những công nghệ tương tự trong thời gian gần đây. Siri vừa mới xuất hiện ít lâu cùng với Apple và đã giành được khá nhiều sự chú ý. Trong vòng 5 đến 10 năm trở lại đây, đã có những bước tiến gì trong công nghệ này, cả trong khía cạnh nhận dạng giọng nói, và quan trọng hơn là trên phương diện tương tác qua đối thoại tự nhiên?

Andy: Thật buồn cười vì tôi đã làm việc tại Nuance trong hơn 13 năm qua và đã làm rất nhiều việc liên quan đến các hệ thống IVR, vì thế chúng tôi đã sống trong sự chuyển giao này và những bước tiến kỹ thuật gần như được quy tụ trong Siri và chương trình hỗ trợ chăm sóc khách hàng mà chúng tôi gọi là “Nina”.

Brett: Cái tên Nina có ý nghĩa gì không?

Andy: Đôi khi thì cũng có. Chúng tôi vẫn thỉnh thoảng thích gọi là Trợ lý tương tác tự nhiên của Nuance (Nuance Interactive Natural Assistant). Nhưng chúng tôi vẫn thích gọi cô ấy đơn giản là Nina hơn.

Hiện nay chúng ta đang chứng kiến những bước đột phá thật sự trong lĩnh vực đối thoại và khả năng trao đổi một cách vô cùng tự nhiên và suôn sẻ với các trợ lý ảo. Điều này đã mang lại chuẩn mực mới về mức độ tự nhiên đối với các chương trình này và chúng ta đã bắt đầu bước vào giai đoạn thật sự xem đó là những trợ lý thực thụ.

– Andy Mauro, lãnh đạo dự án Giải pháp Nina, Nuance

Brett: “Cô ấy”?

Andy: Đúng thế. Những tiến bộ công nghệ quả thật rất đáng kinh ngạc. Chúng tôi khởi đầu bằng việc nhận diện được lời nói, chuyển lời nói thành dạng chữ và ngày càng hoàn thiện khả năng này. Nhưng bước đột phá thật sự nằm ở khía cạnh ngôn ngữ tự nhiên, mà hiện tại khái niệm này còn đang được định nghĩa khá mơ hồ. Chuyển lời nói thành ký tự, từ đó xác định được ý nghĩa, và hiện nay chúng tôi đang thực hiện rất tốt công đoạn sau. Đó chính là khả năng biến những câu nói rất dài và phức tạp, với nhiều cách thể hiện khác nhau, để chuyển nó thành những cấu trúc ngữ nghĩa mà chương trình có thể học hỏi và xử lý bằng nhiều cách thú vị khác nhau.

Hiện nay chúng ta đang chứng kiến những bước đột phá thật sự trong lĩnh vực đối thoại và khả năng trao đổi một cách vô cùng tự nhiên và suôn sẻ với các trợ lý ảo. Điều này đã mang lại chuẩn mực mới về mức độ tự nhiên đối với các chương trình này và chúng ta đã bắt đầu bước vào giai đoạn thật sự xem đó là những trợ lý thực thụ. Chúng tôi xem những công nghệ này như các hệ thống mà anh có thể tương tác và xây dựng quan hệ. Cũng nhờ vào những tiến bộ công nghệ mà cách sử dụng chúng trở nên vô cùng đơn giản.

Brett: Robert, liệu anh có cho rằng, đối với Nuance, các anh đang bán những công nghệ như Nina để thay thế cho các tương tác giữa người với người, hay anh cho rằng đó là cầu nối giữa công nghệ với con người?

Robert: Giải pháp của chúng tôi từ trước đến nay luôn tập trung vào việc hỗ trợ chăm sóc khách hàng – giúp người dùng có thể giải quyết được nhiều việc hơn mà không nhất thiết phải nói chuyện với một nhân viên. Một ví dụ tốt để xem xét việc này là việc tính tiền tại siêu thị. Anh có thể tự làm việc đó, tự tính tiền cho hóa đơn mua sắm của mình; thỉnh thoảng anh phải đưa giấy tờ tùy thân để chứng minh tuổi khi mua rượu, nhưng trong phần lớn các trường hợp, những việc này anh đều có thể tự làm được. Chúng tôi sẽ tập trung vào việc trả lời câu hỏi, “Làm thế nào chúng tôi có thể khiến những trải nghiệm này giống với tương tác giữa người với người hơn, và giúp con người thực hiện những việc này nhanh chóng, hiệu quả và chính xác hơn?”. Nhưng đồng thời chúng tôi cũng kết hợp với các yếu tố khác để hoàn thiện nếu cần thiết.

Mở rộng vấn đề thêm một chút, hiện chúng tôi đã cung cấp các giải pháp IVR dựa trên nền tảng điện thoại trong suốt 20 năm qua, chúng tôi đã triển khai hơn 3.000 tổng đài, và vì thế cũng gặt hái nhiều kinh nghiệm trong lĩnh vực này. Công nghệ nhận diện giọng nói cho phép anh đi tắt trong hệ thống IVR thay vì phải “nhấn nút số để đến thư mục tiếp theo”. Anh chỉ cần phát ra tiếng nói là sẽ được chuyển tiếp đến thư mục anh cần. Nhưng như thế vẫn là anh phải trải qua nhiều bước. Khi anh đưa công nghệ hiểu được ngôn ngữ tự nhiên (natural language understanding – NLU) vào và với những gì chúng tôi đã thực hiện được về công nghệ với Nina, anh có thể được chuyển thẳng đến thư mục anh cần. Tôi có thể nói, “Hãy thanh toán đầy đủ hóa đơn thẻ Visa của tôi vào thứ ba tuần sau bằng cách trích tiền từ tài khoản tiết kiệm của tôi”, và hệ thống sẽ có thể hiểu được điều đó, và ngay lập tức có lời xác nhận. Đó là sự cải thiện vượt bậc đối với các hệ thống dựa trên giọng nói mà chúng tôi đã thực hiện được trong nhiều năm qua.

Brett: Andy, anh nghĩ mất bao lâu nữa để chúng ta thấy giọng nói hay các công cụ nhân trắc học khác trở thành chuẩn mực trong nhận diện danh tính? Chúng ta hiện đang phải đối mặt với các vấn đề về nhận diện mà các công cụ nhận diện truyền thống như số thẻ An sinh xã hội hoặc thậm chí là chữ ký – đều không đủ khả năng ứng dụng trên môi trường số. Theo đánh giá của anh, là một nhà khoa học trong lĩnh vực này đồng thời cũng là chuyên gia công nghệ, còn bao lâu nữa để các tiêu chuẩn nhân trắc học trở thành thông dụng?

Andy: Một trong những vấn đề mà chúng tôi đã nghe nhiều người thảo luận, về ý tưởng của công nghệ kết hợp nhiều kênh khác nhau và sự hiện diện khắp nơi của các dịch vụ này ở mọi nơi anh đến. Động vào nó cũng tức là trả lời cho câu hỏi “Khi nào các dấu hiệu nhân trắc học trở nên phổ biến?”. Một trong những vấn đề với các dấu hiệu nhân trắc học này là khả năng thực hiện thao tác mà chúng tôi gọi là “đăng ký”. Cần phải có một bước trong đó anh tập cho hệ thống nhận diện được mẫu hình giọng nói của anh, cũng như với dấu vân tay. Khi xét đến việc những hệ thống này xuất hiện trên tất cả các kênh di động, trang web, IVR, trên các thiết bị khác nhau trong xe hơi của anh, thậm chí là cả trên ti vi, chúng tôi bắt đầu thấy rất nhiều nguồn nhận diện dữ liệu nhân trắc học – thông thường ngay khi anh nói chuyện với chúng tôi, chúng tôi đã có thể đăng ký cho anh rồi, và chúng tôi đã thấy có một số khách hàng ứng dụng công nghệ này, vì thế anh thậm chí còn không cần phải biết là hệ thống đã tự có khả năng tổng hợp mẫu hình giọng nói của anh.

Sự hiện diện trải rộng của các hệ thống này, đặc biệt là trợ lý ảo, sẽ giúp giải quyết những trở ngại nhỏ về kỹ thuật đối với bước đăng ký, mà hiện nay đang là trở lực. Tôi cũng nghĩ rằng người dùng sẽ bắt đầu nhận biết được (và hiện nay vấn đề này cũng đang được nhắc đến nhiều) rằng thông tin của họ có khả năng bị đe dọa với các phương tiện truyền thống hiện nay – mật mã bốn chữ số và số PIN bảo mật – và khi công chúng biết được kiến thức về tính bảo mật cao của các dữ liệu nhân trắc học, và về công nghệ nhân trắc học nói chung, họ sẽ làm quen dần và thấy thoải mái với những công nghệ này và hiểu được rằng thực chất đây là biện pháp bảo mật tốt hơn các phương pháp họ đang sử dụng. Khi chúng tôi triển khai công nghệ liên kết nhiều kênh này, và khi trợ lý ảo trở nên thông dụng, thì các dữ liệu nhân trắc học trong vòng vài năm sẽ được sử dụng rộng rãi.

Brett: Liệu chúng ta có cần đến một trung tâm dữ liệu nhân trắc học tập trung, một dạng cơ quan quản lý danh tính có thể ghi nhận tất cả những công tác này không? Hay sẽ xuất hiện một hình thức tương tác giữa các ứng dụng với nhau?

Robert: Chúng tôi nhận thấy các khách hàng muốn có hệ thống dữ liệu nhân trắc học riêng. Chúng tôi có hơn 23 triệu người dùng đã đăng ký trên hệ thống, một con số tương đối lớn trên thị trường hiện nay. Nhưng con số 23 triệu so với hàng tỉ người trên thế giới thì lại chỉ là một phần quá nhỏ của tiềm năng thị trường. Tôi thật sự cho rằng làn sóng sẽ bắt đầu từ một ngân hàng nào đó muốn sở hữu toàn bộ dữ liệu giọng nói khách hàng của mình trên tất cả các kênh. Và theo thời gian, sẽ có thời cơ để một cơ quan lưu trữ tập trung xuất hiện. Nhưng con người sẽ phải tập làm quen với công nghệ trước khi điều này xảy ra. Đến lúc đó, lợi ích của việc có một cơ quan lưu trữ tập trung mà các ngân hàng, tập đoàn hàng không và khách sạn, hoặc nhiều ngân hàng khác nhau có thể cùng chia sẻ dữ liệu giọng nói của “Robert Weideman” chẳng hạn, điều này sẽ đến, nhưng sẽ đến sau một thời gian khá lâu. Điều quan trọng nhất, như Andy đã nói, bắt đầu bằng việc nhìn nhận được giá trị của dữ liệu giọng nói và thời gian tiết kiệm được khi sử dụng công nghệ này.

BÀI HỌC RÚT RA

Bạn có thể cho rằng việc cố gắng biến công nghệ mô phỏng ngày càng trở nên giống con người hơn là một việc phi lý và rồi sẽ phản tác dụng – nhưng chẳng phải cuối cùng thì điểm cốt lõi của việc làm người chẳng phải là để có thể tự suy nghĩ cho bản thân, và chắc chắn điều này sẽ mang lại trải nghiệm khách hàng tốt nhất, đúng không? Nếu bạn theo dõi trang Twitter hoặc các cập nhật trên Facebook những ngày gần đây, bạn sẽ thấy có rất nhiều trải nghiệm dịch vụ hoàn toàn không đi đúng hướng.

Tôi thuộc nhóm chuyên quan sát những xu hướng và tin rằng các dự đoán khoa học viễn tưởng thường là khá chính xác trong lĩnh vực phát triển công nghệ. Dù một vài công nghệ được miêu tả trong các bộ phim khoa học viễn tưởng vẫn còn vô cùng xa xôi, như cách di chuyển trong Star Trek, hay trong việc ý thức có thể được tải về và nâng cấp như trong phim The Culture (của đạo diễn Iain Banks), một vài công nghệ như in 3D và tái lập vật thể, hoặc truyền thông trực tiếp trên toàn cầu (như cách thức trong Star Trek) ngày nay đã trở thành hiện thực. Một chủ đề thường xuyên được nhắc đến trong rất nhiều bộ phim khoa học viễn tưởng chính là khái niệm trí thông minh nhân tạo, hoặc chí ít là khả năng trò chuyện với một chiếc máy tính và chiếc máy này có thể trả lời một cách tự nhiên. Dẫu công nghệ như Siri hay Nina còn chưa hoàn thiện, khả năng hiểu ngôn ngữ thường ngày của các trợ lý ảo này vẫn đạt những bước tiến vượt bậc đến mức có lẽ trong vòng 5 năm tới, những đối thoại như vậy sẽ trở nên mạch lạc và trơn tru hơn hẳn.

Trên thực tế, những tác vụ mà Siri, Google Now (với công cụ hỗ trợ bằng giọng nói) và Nina được như hiện nay đã là vô cùng tuyệt vời so với công nghệ chỉ mới cách đây 5 năm. Mười năm trước đây, chúng ta vẫn đang tranh cãi xem liệu những gì mà chúng ta đang chứng kiến ngày nay, liệu có thể trở thành hiện thực được hay không; còn hiện giờ chúng ta đang nói về cách thức nhận biết giọng nói để mô phỏng gần nhất với một trợ lý là người thật. Sau đây là một trích dẫn hay từ tạp chí Forbes trong bài báo nói về khả năng nhận diện giọng nói của Google Now, minh chứng cho những bước tiến chúng ta đã đạt được trong vài năm trở lại đây:

Một cải thiện nổi bật trong những nỗ lực của Google nhằm nhận diện giọng nói... áp dụng một nhánh AI(5) đang phát triển nhanh chóng được gọi là học hỏi sâu để nhận biết giọng nói và tất cả ý nghĩa, ngay cả trong môi trường có tiếng ồn... Công nghệ này đang nỗ lực mô phỏng cách thức các lớp tế bào thần kinh trong vỏ não người, nhận biết được các hình mẫu và cuối cùng là thực hiện việc mà chúng ta gọi là suy nghĩ.

– Bài báo Gặp người đã giúp Google đánh bại Siri của Apple, tạp chí Forbes, tháng 5/2013(6)

5 AI (tức Artificial intelligence): trí thông minh nhân tạo.

6 Bài “Gặp người đã giúp Google đánh bại Siri của Apple”, Forbes, tháng 5/2013, www.forbes.com/sites/roberthof/2013/05/01/meet-the-guy-who-helped-google- beat-apples-siri/.

Ý nghĩa của tất cả những bước hoàn thiện này là giúp các doanh nghiệp chuẩn bị sẵn sàng cho những công cụ hỗ trợ thông minh được cài đặt sẵn trên điện thoại di động và máy tính bảng, IVR, ATM và nhiều kênh khác. Dần dà, chúng có thể mô phỏng tương tác giữa người với người trong việc giải quyết 70-80% những tình huống giải đáp dịch vụ thông thường, ví dụ như:

- Số dư tài khoản của tôi.

- Tôi vừa đánh mất thẻ.

- Liệu tôi có thể tăng hạn mức tín dụng hoặc tiền mặt trên thẻ không?

- Giao dịch cuối cùng được thực hiện là gì?

- Có trục trặc gì với thẻ/ tài khoản của tôi không?

Khi điện thoại di động đã trở thành công cụ cho các trải nghiệm như vậy, thì việc tiếp xúc với từng con người sẽ ngày càng ít khác biệt hơn. Khi điều này xảy ra, việc cấp thiết đối với các ngân hàng là sắp xếp thứ tự ưu tiên thật cẩn thận khi hướng dẫn một khách hàng đến tương tác với một nhân viên.

Một thông điệp chủ chốt nữa cần được rút ra ở đây, đó là các công cụ nhân trắc học. Dù là giọng nói, vân tay, nhận diện khuôn mặt, hay các công cụ khác, nếu bạn là ngân hàng, bạn cần bắt đầu thu thập dữ liệu và đưa các dữ liệu này vào một hệ thống tổng hợp thông tin khách hàng trung tâm. Nếu một ngân hàng chưa có công cụ tập trung thông tin khách hàng thì việc kết nối với dữ liệu nhân trắc học gần như là không thể. Đối với các ngân hàng, một trung tâm dữ liệu tập trung các thông tin nhân trắc học đáng tin cậy và thủ thuật suy luận từ trải nghiệm tiềm năng thanh toán gắn liền với tài khoản ngân hàng đang hoạt động có lẽ sẽ trở thành dữ liệu có giá trị cao nhất mà ngân hàng đó sở hữu. Khả năng sử dụng dữ liệu này để tìm kiếm ứng viên tiềm năng cho một vị trí đang tuyển, mai mối cho khách hàng trên các trang hẹn hò trực tuyến, hay cho một đại lý bất động sản tìm cách biết được liệu một khách hàng có thật sự được chấp thuận một khoản vay mua nhà hay không, tất cả những trường hợp trên đều là thắng lợi lớn. Một điều mà các ngân hàng rất giỏi chính là xác định nhân thân, và khi việc này được chuyển sang chế độ nhận dạng trực tuyến, các ngân hàng có thể trở thành đơn vị tiên phong trong lĩnh vực này.

Dù việc nhận diện nhân dạng thông qua giọng nói có thể có khả năng phục vụ khách hàng tương đương hay vượt trội hơn so với con người (ít nhất là trên phương diện chi phí), hay có thể trở thành nền tảng để mở rộng dịch vụ của các ngân hàng từ nhận diện đơn thuần trở thành nền tảng cho các tương tác và xác định danh tính – thì tất cả các công nghệ này đều sẽ trở thành một thành phần tích hợp vào lĩnh vực ngân hàng trực tuyến trong vòng ba đến năm năm tới.

Hãy để lại chút cảm nghĩ khi đọc xong truyện để tác giả và nhóm dịch có động lực hơn bạn nhé <3