Trang Chủ Đặc trưng Cách ghép hình của google đang cố gắng giải độc internet

Cách ghép hình của google đang cố gắng giải độc internet

2024

Mục lục:

Phối cảnh giữa các trận đấu hét
Ghép hình và Google
AI là 'Sai và câm đôi khi'
Điểm độc tính là gì?
Thử nghiệm tò mò của Reddit
Phán quyết phức tạp trong tranh luận trực tuyến
Tất cả các bình luận phù hợp để in
Bên trong Moderator, Giao diện Nhận xét NYT
'Chúng tôi không thay thế bạn bằng máy móc'
Hét vào vực thẳm

Video: Vitamin C - Lá bàng - Muối hộ: CÁCH DƯỠNG CÁ định kỳ hàng tuần cho bể cá khỏe và đẹp. (Tháng mười một 2024)

Internet có thể cảm thấy như một nơi độc hại. Troll xuất hiện trên các phần bình luận và các chủ đề truyền thông xã hội để đẩy lùi sự ghét bỏ và quấy rối, biến các cuộc thảo luận có khả năng khai sáng thành các cuộc tấn công hominem quảng cáo và chồng chất nhóm. Việc bày tỏ ý kiến trực tuyến thường không có vẻ đáng giá với vitriol.

Các nền tảng xã hội khổng lồ, bao gồm cả Facebook, Twitter và YouTube, thừa nhận họ không thể cảnh sát đầy đủ các vấn đề này. Họ đang trong một cuộc chạy đua vũ trang với bot, troll và mọi người không mong muốn khác trượt qua các bộ lọc nội dung. Con người không có khả năng thể chất để đọc từng bình luận trên web; những người cố gắng thường hối tiếc

Những người khổng lồ công nghệ đã thử nghiệm nhiều tổ hợp điều độ khác nhau của con người, thuật toán AI và bộ lọc để lội qua hàng loạt nội dung chảy qua nguồn cấp dữ liệu của họ mỗi ngày. Jigsaw đang cố gắng tìm một khu vực giữa. Công ty con và vườn ươm công nghệ của Alphabet, trước đây gọi là Google Ideas, đang bắt đầu chứng minh rằng máy học (ML) được chế tạo thành công cụ cho người điều hành con người có thể thay đổi cách chúng ta tiếp cận vấn đề độc tính của internet.

Phối cảnh là một API được phát triển bởi nhóm Công nghệ lạm dụng truy cập của Jigsaw và Google. Nó sử dụng ML để phát hiện hành vi lạm dụng và quấy rối trực tuyến và chấm điểm các nhận xét dựa trên tác động nhận thức mà họ có thể có đối với cuộc trò chuyện nhằm giúp cuộc sống của người điều hành con người dễ dàng hơn.

Phối cảnh giữa các trận đấu hét

Công nghệ nguồn mở được công bố lần đầu tiên vào năm 2017, mặc dù sự phát triển trên nó đã bắt đầu vài năm trước đó. Một số trang web đầu tiên thử nghiệm với Phối cảnh là các ấn phẩm tin tức như Thời báo New York và các trang web như Wikipedia. Nhưng gần đây, Phối cảnh đã tìm thấy một ngôi nhà trên các trang web như Reddit và nền tảng bình luận Disqus (được sử dụng trên PCMag.com.)

CJ Adams, giám đốc sản phẩm của Pers perspective, cho biết dự án muốn kiểm tra xem giọng nói của mọi người bị im lặng trên mạng như thế nào. Jigsaw muốn khám phá cách lạm dụng mục tiêu hoặc bầu không khí quấy rối chung có thể tạo ra hiệu ứng ớn lạnh, khiến mọi người nản lòng đến mức họ cảm thấy không đáng để dành thời gian hay năng lượng để thêm tiếng nói vào cuộc thảo luận. Bạn có thường xuyên thấy một tweet, bài đăng hoặc bình luận và chọn không phản hồi vì chiến đấu với những kẻ troll và nhận Mad Online không đáng để làm nặng thêm?

"Thật dễ dàng để phá hỏng một cuộc trò chuyện trực tuyến, " Adams nói. "Thật dễ dàng để nhảy vào, nhưng một người thực sự có ý nghĩa hoặc độc hại có thể loại bỏ những giọng nói khác. Có thể 100 người đọc một bài báo hoặc bắt đầu một cuộc tranh luận, và thường thì bạn kết thúc với những tiếng nói lớn nhất trong phòng là những người duy nhất còn lại, trong một mạng internet được tối ưu hóa cho lượt thích và chia sẻ. Vì vậy, bạn loại im lặng tất cả những giọng nói này. Sau đó, những gì xác định cuộc tranh luận chỉ là tiếng nói lớn nhất trong phòng. Trận đấu la hét. "

Ghép hình và Google

Đó là một năm khó khăn cho công ty chị em của Jigsaw, Google, nơi đã vật lộn với các vấn đề bảo mật dữ liệu, đẩy lùi nhân viên về sự tham gia của nó vào các dự án cho Lầu năm góc và Trung Quốc, và tiết lộ về việc xử lý quấy rối tình dục. Không đề cập đến một phiên điều trần Quốc hội gây tranh cãi trong đó CEO Sundar Pichai được các nhà lập pháp nướng.

Ở tại Jigsaw, vườn ươm vị tha của Alphabet, mọi thứ đã bớt kịch tính hơn một chút. Nhóm nghiên cứu đã dành thời gian kiểm tra các hình thức kiểm duyệt kỹ thuật hơn, chẳng hạn như ngộ độc DNS với ứng dụng Intra và các cuộc tấn công DDoS với Project Shield. Với quan điểm, mục tiêu là trừu tượng hơn. Thay vì sử dụng học máy để xác định những gì đang hoặc không chống lại một bộ quy tắc nhất định, thách thức của Phối cảnh là một vấn đề mang tính chủ quan mạnh mẽ: phân loại tác động cảm xúc của ngôn ngữ.

Để làm điều đó, bạn cần xử lý ngôn ngữ tự nhiên (NLP), phân tích một câu để phát hiện các mẫu. Nhóm Phối cảnh đang phải đối mặt với các vấn đề như sai lệch xác nhận, nhóm, và hành vi quấy rối trong một môi trường nơi công nghệ đã khuếch đại phạm vi của họ và khiến chúng khó giải quyết hơn.

AI là 'Sai và câm đôi khi'

Cải thiện các cuộc hội thoại trực tuyến với học máy không phải là một nhiệm vụ đơn giản. Nó vẫn là một lĩnh vực nghiên cứu mới nổi. Các thuật toán có thể bị sai lệch, các hệ thống máy học đòi hỏi sự tinh tế vô tận, và những vấn đề khó khăn và quan trọng nhất vẫn chưa được khám phá.

Nhóm nghiên cứu Hội thoại AI, đã tạo ra Viễn cảnh, bắt đầu bằng cách gặp gỡ các tờ báo, nhà xuất bản và các trang web khác lưu trữ các cuộc hội thoại. Một số trang web đầu tiên thử nghiệm công nghệ này là Thời báo New York, Wikipedia, Người bảo vệ và Nhà kinh tế .

Vào năm 2017, nhóm đã mở ra bản demo Phối cảnh ban đầu thông qua trang web công cộng như một phần của thử nghiệm alpha, cho phép mọi người nhập hàng triệu bình luận ác ý, lạm dụng vào trang web. Nó giống như thử nghiệm chatbot Tây khét tiếng của Microsoft, ngoại trừ thay vì lừa bot trả lời các tweet phân biệt chủng tộc, Jigsaw đã sử dụng độc lực đám đông làm dữ liệu huấn luyện để cung cấp mô hình của mình, giúp xác định và phân loại các loại lạm dụng trực tuyến khác nhau.

Việc chạy thử công khai ban đầu không suôn sẻ. "Trolls Across America" của Wired, đã phá vỡ tính độc hại khi bình luận trên toàn quốc dựa trên tính điểm phối cảnh, cho thấy thuật toán vô tình phân biệt đối xử với các nhóm theo chủng tộc, bản sắc giới tính hay khuynh hướng tình dục.

Adams đã thẳng thắn về thực tế rằng thử nghiệm ban đầu của Phối cảnh cho thấy những điểm mù lớn và sai lệch thuật toán. Giống như công cụ tuyển dụng bị loại bỏ của Amazon, được đào tạo trong nhiều thập kỷ dữ liệu công việc thiếu sót và phát triển thành kiến đối với ứng viên nữ, các mô hình Phối cảnh ban đầu có những lỗ hổng rõ ràng vì dữ liệu được đào tạo.

"Trong ví dụ về các nhóm được nhắm mục tiêu thường xuyên, nếu bạn xem phân phối trên các nhận xét trong bộ dữ liệu đào tạo, có một số lượng nhỏ các bình luận có nội dung bao gồm từ 'gay' hoặc 'nữ quyền' và đang sử dụng nó theo hướng tích cực cách, "Adams giải thích. "Những bình luận lạm dụng sử dụng những từ như những lời lăng mạ. Vì vậy, ML, nhìn vào các mẫu, sẽ nói, " Này, sự hiện diện của từ này là một dự đoán khá tốt về việc liệu tình cảm này có độc hại hay không. "

Ví dụ: thuật toán alpha có thể đã bị gắn nhãn nhầm là "Tôi là một người đồng tính tự hào" hoặc "Tôi là một người theo chủ nghĩa nữ quyền và chuyển giới" với điểm số độc tính cao. Nhưng quá trình đào tạo công khai minh bạch, trong khi đau đớn là một bài học vô giá cho Jigsaw về hậu quả của sự thiên vị ngoài ý muốn, Adams nói.

Khi đào tạo các mô hình học máy về một thứ gì đó gây khó chịu và cá nhân như lạm dụng và quấy rối trực tuyến, sự tồn tại của thiên vị thuật toán cũng nhấn mạnh tại sao một mình AI không phải là giải pháp. Các công ty xã hội như Facebook và YouTube đều đã quảng cáo các tính năng kiểm duyệt nội dung AI của nền tảng của họ chỉ để quay lại giữa vụ bê bối và chính xác bằng cách thuê hàng ngàn người điều hành con người.

Trò chơi ghép hình là sự kết hợp của cả hai. Viễn cảnh không phải là thuật toán AI đưa ra quyết định trong chân không; API được tích hợp vào các giao diện quản lý nội dung và kiểm duyệt cộng đồng để phục vụ như một công cụ hỗ trợ cho người điều hành con người. Các kỹ sư phối cảnh mô tả kiểm duyệt ngôn từ thù hận có và không có ML bằng cách sử dụng một phép tương tự haystack: AI giúp bằng cách tự động hóa quá trình phân loại, giảm bớt đống cỏ khô trong khi vẫn cho con người nói cuối cùng về việc liệu một bình luận bị coi là lạm dụng hay quấy rối.

"Đây là khả năng mới của ML, " Adams nói. "Mọi người nói về AI thông minh như thế nào, nhưng họ thường không nói về tất cả những cách nó sai và đôi khi thật ngu ngốc. Ngay từ đầu, chúng tôi đã biết rằng điều này sẽ gây ra rất nhiều sai lầm, và vì vậy chúng tôi đã nói, 'Điều này công cụ này rất hữu ích cho kiểm duyệt con người được hỗ trợ bằng máy, nhưng nó chưa sẵn sàng để đưa ra quyết định tự động. ' Nhưng nó có thể khiến vấn đề 'kim trong đống cỏ khô' phát hiện ra lời nói độc hại này và đưa nó xuống một nắm cỏ khô.

Điểm độc tính là gì?

Khía cạnh gây chia rẽ nhất trong mô hình của Phối cảnh là đưa các con số vào một biến chủ quan là "độc tính". Điều đầu tiên Adams chỉ ra là điểm số của Phối cảnh là một dấu hiệu của xác suất, không phải mức độ nghiêm trọng. Số cao hơn thể hiện khả năng cao hơn là các mẫu trong văn bản giống với các mẫu trong nhận xét mà mọi người đã gắn thẻ là độc hại.

Đối với những gì "độc hại" thực sự có nghĩa là gì, nhóm Phối cảnh định nghĩa rộng rãi là "một nhận xét thô lỗ, thiếu tôn trọng hoặc không hợp lý có khả năng khiến bạn rời khỏi một cuộc thảo luận." Nhưng làm thế nào mà biểu hiện có thể tinh tế. Vào năm 2018, Jigsaw đã hợp tác với Phòng thí nghiệm trí tuệ nhân tạo Rhodes (RAIL) để phát triển các mô hình ML có thể thu được những hình thức mơ hồ về lời nói đe dọa hoặc thù hận hơn, chẳng hạn như bình luận bác bỏ, hạ thấp hoặc mỉa mai mà không công khai.

Cho đến thời điểm này, hầu hết các mô hình của Phối cảnh đã được đào tạo bằng cách yêu cầu mọi người đánh giá các nhận xét trên internet theo thang điểm từ "rất độc hại" đến "rất lành mạnh". Sau đó, các nhà phát triển có thể hiệu chỉnh mô hình để gắn cờ các nhận xét trên một ngưỡng nhất định, từ 0, 0 đến 1, 0. Điểm trên 0, 9 cho thấy xác suất độc tính cao và điểm 0, 5 hoặc thấp hơn có nghĩa là mức độ chắc chắn của thuật toán thấp hơn nhiều. Phối cảnh cũng sử dụng cái được gọi là chuẩn hóa điểm số, cung cấp cho các nhà phát triển một đường cơ sở nhất quán để từ đó giải thích điểm số. Adams giải thích rằng tùy thuộc vào diễn đàn hoặc trang web, nhà phát triển có thể trộn và kết hợp các mô hình. Vì vậy, khi một cộng đồng không quan tâm thô tục, thuộc tính đó có thể được cân nhắc.

Adams đã chỉ cho tôi một giao diện kiểm duyệt demo được tích hợp với API phối cảnh. Trong bảng quản trị, bên cạnh các tùy chọn sắp xếp nhận xét theo top, mới nhất, v.v., là một biểu tượng cờ nhỏ để sắp xếp theo độc tính. Ngoài ra còn có một cơ chế phản hồi tích hợp cho người điều hành con người để nói với Phối cảnh rằng nó đã ghi nhận xét không chính xác và cải thiện mô hình theo thời gian.

Anh ta nhấp vào giao diện demo để kiểm duyệt các bình luận trang Wikipedia Talk được ghi bởi các mô hình Phối cảnh khác nhau và biểu đồ biểu đồ phá vỡ các bình luận có khả năng là một cuộc tấn công vào một tác giả trang hoặc một cuộc tấn công vào một người bình luận khác.

"Chúng tôi muốn xây dựng các công cụ kiểm duyệt được hỗ trợ bằng máy để gắn cờ mọi thứ để con người xem xét, nhưng chúng tôi không muốn một số định nghĩa trung tâm hoặc ai đó nói điều gì là tốt và xấu", Adams nói. "Vì vậy, nếu tôi sắp xếp theo độc tính, bạn sẽ thấy các bình luận có ý nghĩa đứng đầu. Nhưng nếu bạn quan tâm hơn, giả sử, các cuộc tấn công hoặc đe dọa danh tính hơn các số liệu như chửi thề, có thể bạn sẽ không sử dụng mô hình độc tính chung. Đây là các thành phần mà bạn có thể trộn. Chúng tôi cung cấp những thứ này và các nhà phát triển cân chúng. "

Thí nghiệm RAIL đang thực hiện một cách tiếp cận chi tiết hơn. Các sinh viên tốt nghiệp Oxford đang xây dựng một bộ dữ liệu gồm hàng chục ngàn bình luận từ phần bình luận của tờ báo Quả cầu và Thư của Canada và các trang Wikipedia Talk. Họ đang yêu cầu "chú thích" của con người trả lời các câu hỏi về từng nhận xét liên quan đến năm thuộc tính phụ của "nội dung không lành mạnh": thù địch hoặc lăng mạ (trolls), bác bỏ, hạ thấp hoặc bảo trợ, mỉa mai và khái quát không công bằng.

Homing trong các thuộc tính tinh tế hơn này đã tiết lộ các vấn đề phức tạp mới với sự thiên vị ngoài ý muốn đối với các nhóm cụ thể và tích cực sai với các bình luận mỉa mai. Đó là một phần của những cơn đau ngày càng tăng của AI, mô hình nuôi dưỡng ngày càng nhiều dữ liệu để giúp nó hiểu được ý nghĩa gián tiếp đằng sau lời nói của con người. Nhóm nghiên cứu vẫn đang tiếp tục thông qua và chú thích hàng ngàn bình luận, và họ có kế hoạch phát hành bộ dữ liệu cuối cùng vào đầu năm nay.

"Những gì chúng tôi muốn hướng tới là một cái gì đó mà cộng đồng có thể ghi một tập hợp các bình luận, và sau đó chúng tôi có thể biến chúng thành một hỗn hợp tùy chỉnh các mô hình Phối cảnh để phù hợp", Adams nói.

Thử nghiệm tò mò của Reddit

Reddit là một mô hình thu nhỏ của mọi thứ tốt và khủng khiếp về internet. Có một cộng đồng subreddit cho mọi chủ đề và sở thích, sở thích kỳ lạ mà bạn có thể nghĩ đến. Jigsaw không hoạt động với Reddit ở cấp độ công ty, nhưng một trong những nơi hấp dẫn nhất trong đó kiểm duyệt AI của Phối cảnh đang được thử nghiệm là trên một subreddit được gọi là r / changemyview.

Đáng ngạc nhiên, có những góc của Internet nơi cuộc tranh luận và thảo luận thực sự vẫn còn xảy ra. Thay đổi Chế độ xem của tôi, hoặc CMV, không giống như hầu hết các tài khoản con khác. Ý tưởng là đăng một ý kiến mà bạn chấp nhận có thể thiếu sót hoặc sẵn sàng thay đổi, sau đó lắng nghe và hiểu các quan điểm khác để xem liệu họ có thể thay đổi suy nghĩ của bạn về một vấn đề hay không. Các chủ đề bao gồm từ các chủ đề trần tục như thứ tự xem thích hợp cho các bộ phim Chiến tranh giữa các vì sao cho đến các cuộc thảo luận nghiêm túc về các vấn đề bao gồm phân biệt chủng tộc, chính trị, kiểm soát súng và tôn giáo.

Change My View là một thử nghiệm thú vị cho Phối cảnh vì subreddit có bộ quy tắc chi tiết riêng để bắt đầu và kiểm duyệt các cuộc hội thoại kích động tranh luận và tranh luận sôi nổi theo thiết kế. Kal Turnbull, người đi theo u / Snorrrlax trên Reddit, là người sáng lập và là một trong những người điều hành r / changemyview. Turnbull nói với PCMag rằng API phối cảnh đặc biệt phù hợp với Quy tắc 2 của phụ, về cơ bản cấm lời nói thô lỗ hoặc thù địch.

"Nghe có vẻ như là một quy tắc đơn giản, nhưng có rất nhiều sắc thái đối với nó", Turnbull, người có trụ sở tại Scotland nói. Thật khó để tự động hóa quy tắc này mà không thông minh về ngôn ngữ. Reddit cung cấp cho bạn thứ gọi là AutoModerator, nơi bạn có thể thiết lập các bộ lọc và từ khóa để gắn cờ. Nhưng có rất nhiều mặt tích cực sai, và nó có thể khá khó để bắt, bởi vì ai đó có thể nói một từ xấu mà không xúc phạm ai đó, và họ cũng có thể xúc phạm ai đó mà không sử dụng bất kỳ từ xấu nào.

Jigsaw đã tiếp cận Turnbull vào tháng 3 năm 2018. Sự hợp tác bắt đầu với Quy tắc 2, nhưng ngay sau đó, nhóm đã xây dựng các mô hình Phối cảnh cho các quy tắc khác. Đây không phải là sự tích hợp đầy đủ của API phối cảnh nguồn mở mà là bot Reddit cho phép người kiểm duyệt gắn cờ các nhận xét được ghi trên ngưỡng độc tính nhất định.

Trong sáu năm qua, Turnbull và các mod khác đã thực hiện tất cả những điều này một cách thủ công từ hàng đợi các báo cáo AutoModerator (từ khóa được gắn cờ) và báo cáo người dùng. Jigsaw đã sử dụng nhiều năm ghi chú vi phạm quy tắc từ người điều hành, họ đã theo dõi thông qua tiện ích mở rộng trình duyệt và xây dựng các mô hình Phối cảnh dựa trên dữ liệu đó kết hợp với một số mô hình độc tính hiện có của Phối cảnh. Trong suốt năm 2018, các mod CMV đã đưa ra phản hồi về các vấn đề như thừa dương tính giả và Jigsaw đã điều chỉnh ngưỡng cho điểm trong khi tiếp tục mô hình hóa nhiều quy tắc hơn của CMV.

Phán quyết phức tạp trong tranh luận trực tuyến

(Bot phối cảnh được tích hợp vào giao diện của người điều hành Reddit.)

Phối cảnh không tồn tại cho tất cả các kiểm duyệt quy tắc của subreddit. Một số quy tắc phức tạp hoặc trừu tượng hơn vẫn nằm ngoài phạm vi của những gì loại ML này có thể hiểu.

Ví dụ, Quy tắc 4 chi phối hệ thống điểm Delta của phụ, trong khi Quy tắc B ngăn người dùng chơi trò bênh vực của quỷ hoặc sử dụng bài đăng để "xà phòng hóa". Điều độ giống như thế đòi hỏi dữ liệu theo ngữ cảnh và sự hiểu biết đơn giản của con người, để phân biệt xem ai đó đang tranh luận một điểm vì lý do thực sự hay chỉ đơn giản là troll.

Trong tương lai gần, chúng ta vẫn sẽ cần mod người. Các kịch bản phán đoán phức tạp hơn này là nơi các người điều hành CMV bắt đầu thấy các vết nứt trong mô hình AI và tự động hóa thông minh hơn có thể xác định liệu tất cả những điều này có thể mở rộng được hay không.

Turnbull nói: "Tôi nghĩ lý do tại sao điều này quá phức tạp là bởi vì đó là sự kết hợp giữa phán đoán của chúng tôi về bài đăng gốc của họ và các tương tác của họ trong toàn bộ cuộc trò chuyện. Vì vậy, đây không chỉ là một bình luận kích hoạt một mô hình". "Nếu một cuộc tranh cãi qua lại và cuối cùng là một bình luận nói 'cảm ơn' hoặc một lời thừa nhận, chúng tôi sẽ để nó đi ngay cả khi một quy tắc bị phá vỡ trước đó trong chủ đề. Hoặc một trò đùa nhẹ nhàng trong bối cảnh có vẻ như là một người thô lỗ, đó là một điều tốt đẹp của con người và đó là điều mà bot chưa nhận được. "

Thay đổi Chế độ xem của tôi là subreddit duy nhất tích cực sử dụng các mô hình Phối cảnh ML để kiểm duyệt tại thời điểm này, mặc dù Adams cho biết nhóm đã nhận được yêu cầu truy cập từ một số người khác. Bộ quy tắc cụ thể của CMV làm cho nó trở thành một trường hợp thử nghiệm lý tưởng, nhưng các mô hình phối cảnh có thể uốn được; subreddits cá nhân có thể tùy chỉnh thuật toán chấm điểm để phù hợp với nguyên tắc cộng đồng của họ.

Bước tiếp theo của Turnbull là loại bỏ CMV khỏi Reddit vì cộng đồng đang phát triển vượt bậc, ông nói. Trong sáu tháng qua, startup mới thành lập của người điều hành đã làm việc với Jigsaw trên một trang web chuyên dụng có chức năng sâu hơn so với giao diện mod và các bot có thể cung cấp.

Dự án vẫn chỉ trong thử nghiệm alpha, nhưng Turnbull đã nói về các tính năng như cảnh báo chủ động khi người dùng đang gõ một bình luận có thể phá vỡ quy tắc, báo cáo tích hợp để cung cấp cho người kiểm duyệt nhiều bối cảnh hơn và dữ liệu lịch sử để đưa ra quyết định. Turnbull nhấn mạnh rằng không có kế hoạch đóng cửa hoặc di chuyển subreddit, nhưng anh ấy rất hào hứng với thử nghiệm mới.

Tất cả các bình luận phù hợp để in

Tùy thuộc vào ngày trong tuần, trang web của Thời báo New York nhận được từ 12.000 đến hơn 18.000 bình luận. Cho đến giữa năm 2017, các phần bình luận của bài báo đã được kiểm duyệt bởi một nhân viên quản lý cộng đồng toàn thời gian, những người đọc từng bình luận và quyết định phê duyệt hay từ chối.

Bassey Etim, người cho đến tháng này là biên tập viên cộng đồng của Thời báo, đã dành một thập kỷ tại bàn Cộng đồng và là biên tập viên của nó kể từ năm 2014. Vào lúc một ngày trong tuần, nhóm có thể có một vài người kiểm duyệt các ý kiến về các câu chuyện ý kiến trong khi khác câu chuyện tin tức. Một bảng tính được chia ra và theo dõi các trách nhiệm khác nhau, nhưng nhóm khoảng một chục người liên tục được chỉ định lại hoặc di chuyển xung quanh tùy thuộc vào tin tức hàng đầu của thời điểm này. Họ cũng cho ăn các mẩu tin từ các bình luận lại cho các phóng viên về thức ăn gia súc tiềm năng.

Cuối cùng, rõ ràng là điều này có hơn 12 người có thể xử lý. Các phần bình luận về các câu chuyện sẽ phải đóng lại sau khi đạt được số lượng bình luận tối đa mà nhóm có thể kiểm duyệt.

Nhóm phát triển đối tượng của tờ báo đã thử nghiệm học máy để phê duyệt nhận xét cơ bản, rõ ràng, nhưng Etim cho biết nó không đặc biệt thông minh hoặc có thể tùy chỉnh. The Times lần đầu tiên tuyên bố hợp tác với Jigsaw vào tháng 9 năm 2016. Kể từ đó, các phần bình luận của nó đã mở rộng từ việc xuất hiện trên dưới 10 phần trăm của tất cả các câu chuyện lên khoảng 30 phần trăm ngày nay và leo lên.

Từ quan điểm của Jigsaw, vườn ươm đã nhìn thấy cơ hội cung cấp dữ liệu ẩn danh từ hàng triệu bình luận mỗi ngày, được kiểm duyệt bởi các chuyên gia có thể giúp tinh chỉnh quy trình. Để đổi lấy dữ liệu đào tạo ML ẩn danh, Jigsaw và Times đã hợp tác để xây dựng một nền tảng có tên Moderator, được tung ra vào tháng 6 năm 2017.

Bên trong Moderator, Giao diện Nhận xét NYT

(Hình ảnh lịch sự của Thời báo New York )

Người điều hành kết hợp các mô hình của Phối cảnh với hơn 16 triệu bình luận được ẩn danh, được kiểm duyệt vào năm 2007.

Những gì nhóm cộng đồng thực sự nhìn thấy trong giao diện Moderator là một bảng điều khiển với biểu đồ biểu đồ tương tác trực quan hóa phân tích nhận xét trên một ngưỡng nhất định. Chẳng hạn, họ có thể kéo thanh trượt qua lại để tự động phê duyệt tất cả các nhận xét chỉ với điểm tóm tắt từ 0 đến 20 phần trăm, dựa trên sự kết hợp giữa tiềm năng của một bình luận về sự tục tĩu, độc tính và khả năng bị từ chối. Có các nút kiểm duyệt nhanh bên dưới để phê duyệt hoặc từ chối nhận xét, trì hoãn hoặc gắn thẻ nhận xét, để tiếp tục cải thiện mô hình của Phối cảnh.

"Đối với mỗi phần của trang web, chúng tôi đã phân tích các bình luận đến và cách phối cảnh sẽ gắn thẻ chúng. Chúng tôi đã sử dụng cả các mô hình Phối cảnh công cộng và các mô hình riêng của chúng tôi duy nhất cho Thời báo New York ", Etim nói. "Tôi sẽ phân tích các bình luận từ mỗi phần và cố gắng tìm ra điểm cắt mà chúng tôi cảm thấy thoải mái khi nói, 'OK, mọi thứ vượt quá xác suất này bằng cách sử dụng các thẻ độc tính cụ thể này, chẳng hạn như tục tĩu, chúng tôi sẽ chấp thuận."

Học máy đang phê duyệt một tỷ lệ bình luận tương đối nhỏ (khoảng 25% hoặc hơn, Etim nói) khi Times hoạt động để đưa ra các bình luận về nhiều câu chuyện hơn và thậm chí là tùy chỉnh cách các mô hình lọc và phê duyệt nhận xét cho các phần khác nhau của trang web. Các mô hình chỉ phê duyệt ý kiến; từ chối vẫn được xử lý hoàn toàn bởi người điều hành.

Những lời bình luận thủ công đã biến mất. Bình luận thường đóng trên một câu chuyện hoặc 24 giờ sau khi nó xuất bản trực tuyến hoặc một ngày sau khi nó xuất bản in, Etim nói.

'Chúng tôi không thay thế bạn bằng máy móc'

Giai đoạn tiếp theo là xây dựng nhiều tính năng hơn vào hệ thống để giúp người điều hành ưu tiên những bình luận nào cần xem xét trước. Càng ngày, việc tự động hóa những gì luôn là một quy trình thủ công đã cho phép người điều hành dành thời gian chủ động làm việc với các phóng viên để trả lời các bình luận. Nó đã tạo ra một vòng phản hồi trong đó các bình luận dẫn đến báo cáo tiếp theo và các câu chuyện bổ sung mà giáo sư có thể lưu và phân bổ lại các tài nguyên để tạo thêm báo chí.

"Người điều hành và quan điểm đã khiến Times phản ứng nhanh hơn với những lo ngại của độc giả, bởi vì chúng tôi có đủ nguồn lực để làm điều đó, cho dù đó là bằng cách tự viết truyện hay làm việc với các phóng viên để tìm ra câu chuyện", Etim nói. "Điều thú vị của dự án này là chúng tôi đã không sa thải bất kỳ ai. Chúng tôi sẽ không thay thế bạn bằng máy móc. Chúng tôi chỉ đơn giản là sử dụng con người chúng tôi có hiệu quả hơn và đưa ra những quyết định thực sự khó khăn."

Bài viết được mở để làm việc với các ấn phẩm khác để giúp phần còn lại của ngành công nghiệp thực hiện loại công nghệ này. Nó có thể giúp các cửa hàng tin tức địa phương có nguồn lực hạn chế để duy trì các phần bình luận mà không cần một đội ngũ chuyên trách lớn và sử dụng các bình luận như Times, để tìm kiếm các khách hàng tiềm năng và thúc đẩy hoạt động báo chí cơ sở.

Etim ví sự điều tiết được hỗ trợ bởi AI để mang lại cho người nông dân một cái cày cơ học so với thuổng. Bạn có thể làm công việc tốt hơn rất nhiều với một cái cày.

"Nếu Phối cảnh có thể phát triển theo đúng cách, hy vọng, nó có thể tạo ra ít nhất một bộ hướng dẫn có thể lặp lại cho các cửa hàng nhỏ, " ông nói. "Đây là một trò chơi dài, nhưng chúng tôi đã thiết lập rất nhiều nền tảng để trở thành một phần của trải nghiệm độc giả đó. Sau đó, có thể những bài báo địa phương này có thể có ý kiến một lần nữa và tạo ra một bãi biển nhỏ chống lại những người chơi xã hội lớn."

Hét vào vực thẳm

Tại thời điểm này, hầu hết chúng ta đã thấy những người bị tấn công hoặc quấy rối trên phương tiện truyền thông xã hội vì đã lên tiếng. Không ai muốn điều đó xảy ra với họ, ngoại trừ những kẻ chuyên đi troll phát triển mạnh về vấn đề đó. Và chúng tôi đã học được rằng hét vào mặt một người xa lạ, những người sẽ không bao giờ lắng nghe một cuộc tranh luận hợp lý không phải là cách sử dụng có giá trị của thời gian chúng ta.

Phối cảnh đang cố gắng nâng cao tính năng động đó, nhưng CJ Adams cho biết mục tiêu rộng lớn hơn là xuất bản dữ liệu, nghiên cứu và các mô hình UX mã nguồn mở mới để tạo ra các cấu trúc mới của cuộc trò chuyện, một nhiệm vụ khó khăn. Làm cho internet trở thành một nơi lành mạnh, đáng để mọi người dành thời gian có nghĩa là nhân rộng các hệ thống này ra ngoài các phần bình luận và tin tức phụ. Cuối cùng, các công cụ AI phải có khả năng xử lý các ứng dụng và mạng xã hội khổng lồ thống trị các tương tác kỹ thuật số hàng ngày của chúng tôi.

Tạm gác lại những gì Facebook, Twitter và những gã khổng lồ xã hội khác đang làm trong nội bộ, cách trực tiếp nhất để thực hiện điều này là đẩy công nghệ từ người điều hành đến chính người dùng. Adams chỉ vào Dự án San hô cho ý tưởng về những gì có thể trông như thế nào.

Dự án Coral ban đầu được thành lập như một sự hợp tác giữa Mozilla Foundation, New York Times và Washington Post. Coral đang xây dựng các công cụ nguồn mở như nền tảng Talk của mình để khuyến khích thảo luận trực tuyến và cung cấp cho các trang web tin tức thay thế cho việc đóng các phần bình luận. Talk hiện cung cấp nền tảng cho gần 50 nhà xuất bản trực tuyến, bao gồm Post, Tạp chí New York, Tạp chí Phố Wall và The Intercept.

Đầu tháng này, Vox Media đã mua lại Dự án Coral từ Quỹ Mozilla; nó có kế hoạch "tích hợp sâu" nó vào hợp xướng, quản lý nội dung và nền tảng kể chuyện của nó.

Phối cảnh có một plugin cho Dự án Coral sử dụng tính năng chấm điểm độc tính dựa trên công nghệ cơ bản của ML và ngưỡng ngưỡng để cung cấp cho người dùng các đề xuất chủ động khi họ nhập, Adams nói. Vì vậy, khi người dùng đang viết bình luận có chứa các cụm từ được gắn cờ là lạm dụng hoặc quấy rối, một thông báo có thể bật lên cho người dùng nói: "Trước khi bạn đăng bài này, hãy nhớ ghi nhớ các nguyên tắc cộng đồng của chúng tôi" hoặc "Ngôn ngữ trong bình luận này có thể vi phạm hướng dẫn cộng đồng. Nhóm kiểm duyệt của chúng tôi sẽ sớm xem xét nó. "

"Cú huých nhỏ đó có thể giúp mọi người chỉ cần suy nghĩ thứ hai, nhưng nó cũng không chặn bất cứ ai, " Adams nói. "Nó không dừng cuộc thảo luận."

Đó là một cơ chế mà các nền tảng trò chuyện và phát trực tuyến trò chơi video đã tích hợp để lạm dụng và quấy rối. Người dùng Twitter rõ ràng cũng có thể được hưởng lợi từ một hệ thống như vậy.

Nó nói lên một ý tưởng mà nhà khoa học nghiên cứu MIT Andrew Lippmann đã đưa ra trong Vấn đề tương lai của PCMag: Ông nói về các cơ chế tích hợp sẽ cho phép mọi người dừng lại và suy nghĩ trước khi họ chia sẻ điều gì đó trực tuyến, để giúp ngăn chặn sự lan truyền thông tin sai lệch. Khái niệm này cũng áp dụng cho thảo luận trực tuyến. Chúng tôi đã tạo ra các hệ thống truyền thông không ma sát có khả năng khuếch đại phạm vi của câu lệnh theo cấp số nhân ngay lập tức, nhưng đôi khi một chút ma sát có thể là một điều tốt, Lippmann nói.

Quan điểm không phải là về việc sử dụng AI như một giải pháp chăn. Đó là một cách để nhào nặn các mô hình ML thành các công cụ cho con người để giúp họ điều chỉnh trải nghiệm của chính họ. Nhưng một điều ngược lại là nếu bạn làm cho mọi người dễ dàng hơn trong việc điều chỉnh tiếng ồn trực tuyến mà họ không thích, thì internet sẽ trở nên thậm chí còn nhiều tiếng vang hơn so với trước đây.

Khi được hỏi liệu các công cụ như Phối cảnh cuối cùng có thể làm trầm trọng thêm điều này hay không, Adams cho biết ông tin rằng các phòng phản hồi trực tuyến tồn tại bởi vì không có cơ chế để tổ chức một cuộc thảo luận nơi mọi người có thể không đồng ý một cách có ý nghĩa.

"Con đường ít kháng cự nhất là 'Những người này đang chiến đấu. Hãy để họ tự đồng ý với chính họ trong góc riêng của họ. Hãy để mọi người tự im lặng'", ông nói. "Bạn để mọi người la hét mọi người khác ra khỏi phòng, hoặc bạn tắt cuộc thảo luận. Chúng tôi muốn Phối cảnh tạo ra một lựa chọn thứ ba."

Adams đã đặt ra một kịch bản mẫu. Nếu bạn hỏi một căn phòng gồm 1.000 người, "Hôm nay có bao nhiêu bạn đọc thứ gì đó mà bạn thực sự quan tâm?" hầu hết người dùng internet sẽ trỏ đến một bài viết, một tweet, một bài đăng hoặc một cái gì đó họ đọc trực tuyến. Nhưng nếu sau đó bạn hỏi họ, "Bao nhiêu trong số các bạn nghĩ rằng nó đáng để bạn dành thời gian để bình luận về nó hoặc có một cuộc thảo luận?" tất cả các tay trong phòng sẽ đi xuống.

"Đối với rất nhiều người trong chúng ta, điều đó không đáng để nỗ lực. Cấu trúc thảo luận mà chúng ta có ngay bây giờ chỉ có nghĩa là trách nhiệm. Nếu bạn có suy nghĩ hợp lý hiện tại hoặc điều gì đó bạn muốn chia sẻ, đối với hầu hết mọi người, họ không ' Tôi muốn tham gia, "Adams nói. "Điều đó có nghĩa là trong số 1.000 người có thể ở trong phòng, bạn chỉ có một số ít được đại diện trong cuộc thảo luận; giả sử, 10 người. Tôi có niềm tin sâu sắc rằng chúng ta có thể xây dựng một cấu trúc cho phép 990 người đó quay lại cuộc thảo luận và làm theo cách mà họ thấy xứng đáng với thời gian của họ. "