Công nghệ mới cho phép bạn đọc sách mà không cần mở nó ra

"Giờ đây, bạn có thể đánh giá một cuốn sách chỉ qua bìa của nó."

Mới ngày thứ Sáu vừa qua, đội nghiên cứu của Viện Công nghệ Massachusetts (MIT) và Học viện Công nghệ Georgia đã trình làng một công nghệ phân tích hình ảnh mới, cho phép máy tính xác định nội dung được in trên từng tờ giấy trong một xấp giấy mà không cần phải lật từng tờ một.

Nó giống như việc Superman sử dụng kỹ năng X-quang của mình để đọc sách, chỉ khác rằng Superman là thuật toán thông dịch chữ cái, còn X-quang là khả năng bức xạ terahertz.

Bức xạ Terahertz (những chấm trắng trong hình)

 

Hệ thống này sử dụng bức xạ terahertz (sự kết hợp của bức xạ điện từ giữa sóng cực ngắn và ánh sáng hồng ngoại), vốn có nhiều ưu thế so với các loại sóng tiếp xúc bề mặt khác như X-quang hay siêu âm.

Bức xạ Tetrahertz được hấp thụ bằng các loại hóa chất qua nhiều cách, qua đó nó có thể sử dụng để phân biệt giấy và mực trong một cuốn sách.

Chiếc máy ảnh terahertz được sử dụng bởi nhóm nghiên cứu có thể phát ra bức xạ siêu ngắn, từ đó giúp đo độ dày của cuốn sách qua việc đếm thời gian để bức xạ từ cuốn sách phản chiếu lại chiếc máy ảnh.

Mực phản chiếu lại bức xạ trên từng trang giấy, vốn có khoảng cách chỉ 20 micromet
 

Những bức xạ siêu ngắn này có thể tính toán chiều sâu rất chính xác, từ đó cho phép các nhà nghiên cứu tính toán khoảng cách từ nguồn phát bức xạ tới từng trang sách trong cuốn sách, vốn chỉ được phân cách bởi không khí có độ sâu 20 micromet.

Mực phản chiếu lại bức xạ trên từng trang giấy, vốn có khoảng cách chỉ 20 micromet

 

Kết quả từ quá trình giấy mực phản chiếu lại bức xạ terahertz qua camera sẽ được phân tích bởi một thuật toán do các kỹ sư tại MIT phát triển, để tạo ra một hình ảnh render trong thời gian thực. Do hình ảnh ban đầu bị biến dạng rất nhiều, vậy nên sau đó nó sẽ tiếp tục được xử lý bởi một thuật toán khác bởi Georgia Tech, từ đó có thể phân biệt từng chữ cái.

Cần thuật toán để phân biệt nét chữ in mờ giữa các trang giấy
 

"Thực sự khả năng nhận diện chữ cái của nó khá là đáng sợ" - Barmak Heshmat, nghiên cứu viên tại MIT chia sẻ. "Rất nhiều website hiện đang có mã CAPTCHA để đảm bảo rằng bạn không phải là robot, và thuật toán này sẽ dễ dàng vượt qua các rào cản đó."

Barmak Heshmat - Nghiên cứu viên tại MIT
 

Công nghệ phân tích hình ảnh qua Terahertz vẫn còn đang rất sơ khai, và mặc dù các nhà nghiên cứu tại MIT khẳng định rằng nó có thể sử dụng để đọc xuyên qua những bức thư từ hàng thập kỷ trước, nó vẫn chưa đủ tốt để có thể đọc được tiểu thuyết "Chiến Tranh và Hòa Bình" của đại thi hào Lev Tolstoy (vốn dài hơn 1000 trang và xuất bản lần đầu năm 1869).

Những nhà nghiên cứu có thể lấy được nội dung của từng tờ giấy trong một xấp giấy, và nhận ra rằng cách thức này cho phép nhận dạng chữ đến trang thứ 9. Sau mức đó, tín hiệu trở nên quá nhiễu để có thể trích xuất thông tin. Nhưng các nhà nghiên cứu tin rằng, với việc cảm biến bức xạ đang ngay một được hoàn thiện, khả năng nhận diện cũng sẽ ngày một tốt hơn. Và đến một ngày nào đó, chiếc máy này có thể đọc được cả cuốn sách mà không cần mở ra.

Đây cũng chính là điều thúc đẩy các nhà nghiên cứu. Ông Heshmat nói rằng bảo tàng Metropolitan tại New York đang rất quan tâm đến dự án này, khi nó cho phép họ trích xuất nội dung của các cuốn sách đã quá cũ, đến độ chỉ cần chạm vào cũng đã khiến chúng bị hỏng.

Ngoài ra, do kỹ thuật phân tích hình ảnh terahertz có thể phân biệt các loại hóa chất khác nhau trên một vật thể, nó còn có thể được sử dụng ngoài mục đích đọc sách, mà cụ thể là đọc tất cả mọi thứ được bố trí trên một bề mặt mỏng.

“Rất nhiều công sức đã được bỏ ra cho công nghệ terahertz” - Bà Laura Waller, giáo sư ngành kỹ thuật điện và khoa học máy tính của Đại học Berkeley chia sẻ. “Đây là sản phẩm đầu tiên sử dụng công nghệ mới, song song với tiến bộ trong lĩnh vực nhận diện hình ảnh, nó sẽ cho phép chúng ta nhìn được những thứ mà quang học thông thường không cho phép. Giờ đây, một cuốn sách có thể được đánh giá chỉ qua bìa của nó.”

 

Theo Genk 

Được đăng vào

Viết bình luận