Cha đẻ Capcha đã giúp số hóa hàng triệu cuốn sách như thế nào?

Từng được Bill Gates dành đến 45 phút để thuyết phục về làm việc cho Microsoft, nhưng Luis Von Ahn, một giáo sư toán học người Guatemala có khuôn mặt “trẻ thơ”, vẫn thẳng thừng từ chối.

Bằng tài năng và đam mê của mình, ông đã tạo ra CAPTCHA – sản phẩm được Yahoo triển khai một tuần sau khi ra đời và được Google mua vài năm sau đó - và Duolingo, đứa con tinh thần thứ hai của ông, đã được định giá 20 triệu USD sau 2 năm ra mắt, và hiện trị có giá 1,5 tỷ USD.

Tuy nhiên, cả CAPTCHA và Duolingo chỉ là "miếng mồi" cho chúng ta, những chú chuột hamster, để quay chiếc bánh xe Internet khổng lồ. Một cách vô tình, chúng ta đã cùng nhau số hóa 2,3 triệu cuốn sách mỗi năm và dịch hàng "núi" nội dung CNN và NY Times sang các ngôn ngữ khác chỉ trong vòng vài tuần.

Thế thì Luis Von Ahn đã làm điều đó như thế nào?

Người dùng số hóa 2,3 triệu cuốn sách mỗi năm mà không hề hay biết

CAPTCHA xuất hiện sau khi một nhà nghiên cứu và cũng là chuyên gia săn tài năng từ Yahoo đến trường của Luis Von Ahn để có một bài giảng mang tên là "10 vấn đề lớn nhất mà chúng ta không biết cách giải quyết". Một trong những vấn đề của họ là những kẻ gửi thư rác sẽ sử dụng phần mềm tự động để tạo ra hàng triệu địa chỉ email giả để gửi đến người dùng những mẩu quảng cáo có nội dung thô tục. Đầu những năm 2000, Yahoo cũng hùng mạnh như Google bây giờ. Vì vậy, Luis đã bắt tay vào công việc này. Kết quả là CAPTCHA được ra đời và Yahoo đã triển khai tính năng này trong vòng một tuần.

Tuy vậy, ông lại nghĩ nếu không tận dụng 500.000 giờ mà mọi người dành ra để điền CAPTCHA mỗi ngày thì thật lãng phí. Thế là anh cho ra đời reCAPTCHA. Với phiên bản mới này, người dùng được cung cấp hai từ để phân biệt. Cả hai từ đều là các bản tài liệu hoặc sách được scan.

Dĩ nhiên, công ty của anh đã biết từ nào được hiển thị trên bản scan đầu tiên. Họ đưa nó cho bạn để thực sự kiểm tra xem bạn có phải "người thật" hay không. Từ thứ hai là một cái gì đó mà họ chưa số hóa. Khi có 10 "người thật" nhập vào cùng một từ, họ biết rằng từ đó là đúng.

Bằng cách này, mỗi năm reCAPTCHA số hóa 2,3 triệu cuốn sách cũ thành các tài liệu web có thể chỉnh sửa và tìm kiếm được. Google đã mua lại công ty với một mức giá đủ để Luis không cần phải làm việc nữa. Điều duy nhất ông phải làm là ở lại Google trong 3 năm. Nhưng ông đã không làm thế.

Người học góp phần dịch một lượng bài báo "khủng" trong khi học ngôn ngữ

Hầu hết nội dung trên Internet là tiếng Anh, điều đó có nghĩa là giáo dục chỉ có thể được tiếp cận đối với những người biết ngôn ngữ này. Vì vậy, Luis quyết định làm một cái gì đó với trí tuệ của mình, bằng cách hợp tác với Severin Hacker để tạo ra một cách học ngôn ngữ miễn phí cho hầu hết mọi người trên thế giới. Một nền tảng dân chủ hóa cho bất cứ ai có kết nối internet.

Giờ đây đã là một doanh nhân dày dạn kinh nghiệm, Luis biết rằng ứng dụng miễn phí cần một cách nào đó để kiếm tiền. Tài khoản ngân hàng của anh không thể tài trợ cho việc kinh doanh mới mãi mãi, vì vậy nó cần phải tự duy trì trong quá trình hoạt động. Thế là anh nghĩ ra cách để người học làm ra tiền cho anh trong lúc học.

Khi học bất kỳ ngôn ngữ nào qua Duolingo, bạn không chỉ được cung cấp các từ ngẫu nhiên. Đôi khi, bạn được giao cả một câu ngẫu nhiên để dịch. Câu này là từ một đoạn trích trong một bài viết của một trong những khách hàng của Duolingo - như CNN hoặc NY Times.

Rõ ràng rằng người học không phải là dịch giả "xịn". Để đảm bảo các bản dịch được chính xác, Duolingo sử dụng một số thủ thuật đằng sau hậu trường để biến 10 bản dịch nghiệp dư thành một bản dịch chuyên nghiệp. Kết quả là bạn không thể phân biệt đâu là sản phẩm của Duolingo và đâu là sản phẩm của một dịch giả được đào tạo bài bản.

Vì vậy, nếu NY Times trả 0,10 USD mỗi từ cho bản dịch của họ - và phải dành nhân lực cho việc quản lý quy trình này - Luis có thể cung cấp bản dịch với giá 0,05 USD mỗi từ. Với lượng người dùng đăng ký Duolingo đủ lớn, họ có thể dịch lượng tài liệu được tạo ra trong cả năm chỉ trong một vài ngày – giúp mang về 42.000 USD cho Luis và đối tác của anh.

Theo: Nhịp Sống Kinh Tế

Tags