(ONECMS) - Trí tuệ nhân tạo trong báo chí đang được sử dụng theo những cách khác nhau, tăng tốc từ nghiên cứu đến ứng dụng trong thực tiễn.
Trong bài viết này, BBT Blog ONECMS thảo luận về một số ví dụ về trí tuệ nhân tạo đang được tích hợp vào tòa soạn và chúng tôi sẽ giải quyết ba câu hỏi sau cho bạn đọc:
Các ví dụ sau đây giúp xác định các định hướng mà AI đang thực hiện trong lĩnh vực báo chí và các cơ hội do các ứng dụng đó tạo ra. Với các ví dụ trường hợp sử dụng AI từ tám tòa soạn uy tín (bao gồm The New York Times và Washington Post), chúng tôi sẽ hướng tới việc vẽ ra một bức tranh về cách báo chí đang thay đổi và chúng tôi hy vọng nó sẽ giúp các tòa soạn hình dung ra tương lai của báo chí trong năm năm tới (và cách tổ chức của tòa soạn để có thể thích ứng).
Trước khi xem xét các ứng dụng trong từng tòa soạn cụ thể, chúng ta sẽ bắt đầu xem xét tổng quan các nghiên cứu này:
AI đang cải thiện tòa soạn theo những cách sau:
Dưới đây là bảy điểm nổi bật ngắn gọn về các trường hợp sử dụng AI tại các tòa soạn lớn. Mỗi ví dụ cung cấp một cái nhìn sâu sắc về cách công nghệ AI hiện đang được sử dụng và những lợi thế mà nó mang lại cho tòa soạn.
Năm 2015, The New York Times đã triển khai dự án AI thử nghiệm được gọi là Editor. Mục đích của dự án là đơn giản hóa quy trình báo chí. Khi viết một bài báo, một nhà báo có thể sử dụng các thẻ để đánh dấu cụm từ, tiêu đề hoặc các điểm chính của văn bản.
Theo thời gian, máy tính học cách nhận ra các thẻ ngữ nghĩa này và tìm hiểu các phần nổi bật nhất của một bài báo. Bằng cách tìm kiếm thông qua dữ liệu trong thời gian thực và trích xuất thông tin dựa trên các danh mục được yêu cầu, chẳng hạn như sự kiện, con người, vị trí và ngày tháng, Editor có thể làm cho thông tin dễ tiếp cận hơn, đơn giản hóa quá trình nghiên cứu và cung cấp khả năng kiểm tra thực tế nhanh chóng và chính xác.
The New York Times cũng đang sử dụng AI theo một cách tiếp cận độc đáo để kiểm duyệt bình luận của người đọc, khuyến khích thảo luận mang tính xây dựng và loại bỏ hành vi quấy rối và lạm dụng. Được biết đến như một diễn đàn sôi nổi và thường xuyên kích thích, phần bình luận của Times hiện được kiểm duyệt bởi một nhóm gồm 14 người chịu trách nhiệm xem xét thủ công hơn 11.000 bình luận hàng ngày. Quá trình tốn nhiều công sức như vậy nhưng cũng chỉ kiểm duyệt bình luận ở mức 10 phần trăm tổng số các bài báo của Times.
Nhưng Times đang thử nghiệm một giải pháp AI có thể chuyển đổi việc kiểm duyệt bình luận và mở rộng tính năng bình luận cho nhiều bài viết hơn, hy vọng sẽ tiết kiệm chi phí cho NYT và cuộc trò chuyện hấp dẫn hơn cho bạn đọc.
The Perspective API được phát triển bởi Jigsaw (một phần của Alphabet, công ty mẹ của Google) sắp xếp các nhận xét của người đọc một cách tương tác để người xem có thể nhanh chóng biết được những nhận xét nào mà họ có thể thấy “độc hại” và những nhận xét nào có thể gây chú ý hơn. Người xem có thể đọc nhận xét bằng cách trượt một thanh trên đầu trang từ trái sang phải. Thanh càng gần về phía bên phải, các bình luận càng trở nên độc hại. Đó là một cách tuyệt vời để người dùng đọc và tương tác với những nhận xét mà họ quan tâm trong khi tránh những nhận xét hung hăng hơn.
PerspectiveAPI cho phép người dùng tìm kiếm các bình luận trên phương tiện truyền thông dựa trên cảm tính (họ gọi tình cảm tiêu cực là "độc tính" trong hình trên) |
BBC là một kho lưu trữ một lượng lớn dữ liệu, từ các câu chuyện tin tức hàng ngày, các tính năng và video, chưa kể các kho lưu trữ.
Sau đó, cũng có dữ liệu từ các nguồn tin tức khác, các nguồn chính phủ và internet. Điều tuyệt vời sẽ là nếu có một cách liên kết tất cả dữ liệu này lại với nhau theo cách giúp nó dễ tiếp cận hơn và đồng thời có ý nghĩa. Kể từ năm 2012, BBC News Labs đã sử dụng công cụ trích xuất dữ liệu Juicer để thực hiện điều đó.
Máy tính theo dõi khoảng 850 nguồn cấp dữ liệu RSS của các trang tin tức toàn cầu và tổng hợp và trích xuất các bài báo từ BBC và các nguồn bên ngoài. Sau đó, nó chỉ định các thẻ ngữ nghĩa cho các câu chuyện và sắp xếp chúng thành một trong bốn danh mục: tổ chức, địa điểm, người và sự vật. Vì vậy, nếu một nhà báo đang tìm kiếm những câu chuyện mới nhất về Tổng thống Trump hoặc các bài báo liên quan đến các công ty trong lĩnh vực AI, Juicer sẽ nhanh chóng tìm kiếm trên web và cung cấp danh sách nội dung liên quan.
Iain Collins của BBC giải thích và trình diễn công nghệ dưới đây trong 3 phút:
Trong tương lai không xa, Juicer cũng có thể được sử dụng để nâng cao trải nghiệm người dùng bằng cách tạo những box tin tức bật lên khi người đọc di chuột qua một số từ nhất định. BBC Lab cũng đang thử nghiệm thêm khả năng này vào nội dung video bằng cách chồng các dữ kiện lên các phần khác nhau của hình ảnh hoặc cảnh quay.
Vào năm 2016, Reuters đã hợp tác với công ty công nghệ ngữ nghĩa Graphiq, để cung cấp cho các tòa soạn số một loạt các hình ảnh dữ liệu tương tác miễn phí trên nhiều chủ đề bao gồm giải trí, thể thao và tin tức. Các tòa soạn có thể truy cập dữ liệu qua Reuters Open Media Express. Sau khi được nhúng vào trang web của tòa soạn, hình ảnh trực quan hóa dữ liệu được cập nhật theo thời gian thực.
Đây là một cách sáng tạo để các tòa soạn thu hút khán giả và cung cấp các câu chuyện tin tức theo hướng dữ liệu, kích thích trực quan và dễ hiểu. Do các thuật toán của Graphiq liên tục xây dựng và cập nhật nên công cụ này cung cấp khả năng truy cập dữ liệu nhanh chóng. Mặc dù không phải tất cả dữ liệu đều yêu cầu AI phải được trực quan hóa và hiển thị, nhưng các công cụ như Graphiq cho phép các tòa soạn hiển thị thông tin phong phú và kết nối hơn bao giờ hết với một bảng hoặc biểu đồ đơn giản.
Trực quan hóa dữ liệu là một cách hiệu quả để trình bày cho người đọc những thông tin phức tạp ở định dạng dễ đọc và dễ hiểu. Phạm vi thông tin có thể đa dạng như “Giá cổ phiếu Apple”, “Mức độ phổ biến của Tổng thống Trump” đến “Phân tích dự đoán cho tiếp thị”, tất cả chỉ bằng một lần nhấp vào nút.
The Post đã thử nghiệm tính năng viết tin tức tự động (đôi khi được gọi là “báo chí rô bốt” hoặc đơn giản là “báo chí tự động”) bằng phần mềm thông minh Heliograf. Bot ra mắt lần đầu tiên vào mùa hè năm 2016 với tin tức về Thế vận hội Olympic Rio. Heliograf tổng hợp câu chuyện tin tức bằng cách phân tích dữ liệu về các trò chơi khi nó xuất hiện.
Thông tin này sau đó được đối sánh với các cụm từ có liên quan trong một mẫu câu chuyện và máy thêm thông tin để tạo một câu chuyện có thể được xuất bản trên các nền tảng khác nhau. Phần mềm này cũng có thể cảnh báo các nhà báo về bất kỳ sự bất thường nào mà nó tìm thấy trong dữ liệu. Điều này có nghĩa là trong suốt Thế vận hội, Heliograf có thể cập nhật thông tin liên quan đến điểm số và tổng số huy chương trong thời gian thực, giải phóng các nhà báo để họ có thể làm việc trong việc tạo ra các nội dung khác.
Các sản phẩm báo chí tự động có sự khởi đầu ban đầu trong các lĩnh vực dựa trên dữ liệu hơn như thể thao và tài chính (xem ví dụ về Yahoo! bên dưới) - nơi dữ liệu thô về các sự kiện tin tức có thể được chuyển thành câu chuyện mạch lạc và có vẻ như Heliograph của Washington Post đang làm được nhiều việc giống nhau.
Phần lớn các phương tiện truyền thông đưa tin ban đầu về “báo chí robot” (hai hoặc ba năm trước) liên quan đến các câu chuyện thể thao và tài chính tại Yahoo!. Bất chấp sự suy giảm kéo dài hàng thập kỷ của công ty (và việc bán gần đây cho gã khổng lồ viễn thông Verizon), Yahoo! vẫn tự hào có một lượng lớn người theo dõi trên các tài sản truyền thông tin tức, tài chính và thể thao của nó.
Automative Insights - một nhà cung cấp dịch vụ ngôn ngữ tự nhiên nổi tiếng - đưa ra một nghiên cứu điển hình về hoạt động của nó với Yahoo! Các môn thể thao. Yahoo! tuyên bố rằng bằng cách tạo nội dung (bài báo, báo cáo, email) với dữ liệu từ các đội thể thao cụ thể (hoặc đội thể thao tưởng tượng), nó là một mũi tên trúng hai mục đích:
Đầu tiên, công ty thu hút độc giả trong các phiên dài hơn với nội dung phong phú, tùy chỉnh (dựa trên dữ liệu thể thao).
Thứ hai, các nhà quảng cáo háo hức tìm kiếm tài liệu hấp dẫn và sẵn sàng chi tiêu nhiều hơn cho các quảng cáo sẽ được hiển thị nhiều hơn trong thời gian dài hơn với nhiều người dùng hơn.
Thông tin chi tiết tự động giải thích những điều cơ bản về sản phẩm báo chí tự động các bạn có thể tham khảo trong video bên dưới:
Associated Press lần đầu tiên sử dụng AI để tạo nội dung tin tức vào năm 2013 để thu thập dữ liệu và viết các bài báo thể thao và tài chính. Ngày nay, tòa soạn AP sử dụng NewsWhip để cập nhật các tin bài thịnh hành trên các phương tiện truyền thông xã hội như Twitter, Facebook, Pinterest và LinkedIn. Trang phân tích của NewsWhip quảng cáo các khả năng chính sau:
Cũng như theo dõi các câu chuyện tin tức, nó có thể phân tích khoảng thời gian thực hoặc lịch sử trên bất kỳ quy mô thời gian nào từ 30 phút đến 3 năm và cung cấp cho các phóng viên các cảnh báo thời gian thực hoặc thông báo hàng ngày. Cũng như các lợi ích bổ sung về tốc độ và phạm vi, các công nghệ AI như NewsWhip có thể tăng độ chính xác của dữ liệu và giảm lỗi khi sao chép - ngoài việc mang lại cho tòa soạn sự cập nhật nhanh chóng.
Như với Yahoo! Thể thao, Thông tin chi tiết tự động cũng đưa ra một nghiên cứu điển hình về hoạt động của nó với Associated Press. AP không viết bài bình luận chính trị dài và sâu sắc chỉ với việc sử dụng AI (và có lẽ sẽ không sớm), nhưng công ty sử dụng sản phẩm “Wordsmith” của Automated Insight để biến dữ liệu thu nhập thô thành các bài báo - điều này cực kỳ giống đối với trường hợp sử dụng với Yahoo!.
Vào năm 2016, Quartz đã nhận được khoản tài trợ 193.000 bảng Anh từ Quỹ Hiệp sĩ để thành lập Bot Studio nhằm tạo ra một bộ công cụ tự động cho các nhà báo. Động thái này được lấy cảm hứng từ thực tế là phương tiện truyền thông tin tức ngày nay không chỉ chuyển từ bản in sang máy tính để bàn sang điện thoại di động mà còn sang các thiết bị kết nối internet khác cho gia đình và xe hơi.
Người dùng đang tương tác với các công ty thông qua trò chuyện, thoại và các kênh mới sáng tạo khác và Quartz cũng muốn tìm ra lợi thế về cách thức tiêu thụ phương tiện truyền thông.
Mặc dù dự án rõ ràng đang ở giai đoạn sơ khai, nhưng các thử nghiệm BotStudio ban đầu đã liên quan đến giao diện tin tức trông giống như “trò chuyện”. Người dùng nhắn tin với các câu hỏi về các sự kiện tin tức, con người hoặc địa điểm và ứng dụng sẽ trả lời bằng nội dung mà ứng dụng tin rằng sẽ phù hợp với họ. Không chắc liệu ứng dụng cụ thể của AI này có được áp dụng để tiêu thụ phương tiện trên quy mô lớn hay không, nhưng rõ ràng là người dùng sẽ bị thu hút bởi những cách ít ma sát để nhận được thông tin và giải trí mà họ muốn, và Quartz muốn thực hiện thay đổi một cách chủ động hơn hơn là phản ứng với nó.
Quartz nhằm mục đích phát triển bot và AI trong các ứng dụng sẽ giao diện liền mạch với tất cả các nền tảng phương tiện. Mặc dù Quartz vẫn đang đánh giá các bước tiếp theo của mình, nhưng một ý tưởng là một bot của tòa soạn được tạo ra để hỗ trợ các nhà báo trong quy trình làm việc của họ bằng cách cải thiện cách các phóng viên có thể tạo dữ liệu và sản xuất tin bài cho các không gian truyền thông mới.
Năm 2016, The Guardian ra mắt Chatbot thông qua Facebook. Để tiết kiệm thời gian cuộn qua hoặc tìm kiếm các câu chuyện tin tức, chatbot cho phép người dùng chọn từ phiên bản Guardian News của Hoa Kỳ, Vương quốc Anh và Úc, chọn thời gian giao hàng từ 6 giờ sáng, 7 giờ sáng hoặc 8 giờ sáng và nó sẽ cung cấp các tin bài được chọn hàng ngày qua Facebook Messenger.
Nếu người dùng chỉ muốn xem nhanh tin nóng và tin tức thể thao hoặc chỉ muốn đọc các tin tức khoa học và công nghệ thịnh hành, Chatbot cũng có thể thêm chúng. Giống như ví dụ Quartz của chúng tôi ở trên, giao diện trả lời tin nhắn trò chuyện có nội dung liên quan có liên quan đến truy vấn của người dùng.
Giao diện Chatbot của Guardian |
Nói chung, những gì có thể được tự động hóa, sẽ được tự động hóa - và chúng ta có thể mong đợi ngành báo chí cũng như vậy. Tuy nhiên, chúng tôi không dự đoán rằng sự phát triển của AI hiện nay trong lĩnh vực báo chí sẽ thay thế được nhà báo.
Các tòa soạn thuê các nhóm người cho các nhiệm vụ tìm hiểu thực tế hoặc kiểm tra thực tế đơn giản (các công việc thường được xử lý ở nước ngoài) sẽ có thể “thay thế” các vai trò lặp lại, hạn chế đó bằng một hệ thống có thể nhanh hơn và (chắc chắn với thời gian) tiết kiệm chi phí hiệu quả. Hầu hết các công việc khác tại một ấn phẩm lớn hoặc trong một tòa soạn sẽ được “tăng cường” với các khả năng bổ sung để thu thập và quản lý dữ liệu.
Cho dù tòa soạn của năm 2025 sẽ đi theo mô hình tòa soạn số, được tích hợp thêm nhiều hệ thống trí tuệ nhân tạo thông minh, nhưng con người và AI vẫn sẽ làm việc cùng nhau và AI sẽ đóng vai trò hỗ trợ, giúp cho công việc của nhà báo dễ dàng và hiệu quả hơn.
Điều rõ ràng cho hiện tại là AI có một vị trí trong tòa soạn để giúp tiết kiệm thời gian và tiền bạc, đồng thời tăng tốc độ và hiệu quả để giúp các nhà báo con người theo kịp với quy mô ngày càng mở rộng của các phương tiện truyền thông toàn cầu. Theo kịp với xu hướng công nghệ báo chí hiện đại, ONECMS sẽ theo dõi những tòa soạn tiêu biểu, lớn nhất trong ngành và làm sáng tỏ các trường hợp sử dụng của họ để phát triển giải pháp tòa soạn ONECMS ngày một toàn diện hơn.