Mục lục:
Video: Nhiá»u cá» thụ báºt gá»c trong mÆ°a á» trung tâm Äà Lạt (Tháng mười một 2024)
Nội dung
- Sử dụng toán học để tìm những người bình luận ngu ngốc nhất (và thông minh nhất)
- Vào danh sách …
- Đáy thùng
Ngày xửa ngày xưa, mọi người hy vọng rằng World Wide Webbernet sẽ đoàn kết mọi người từ mọi tầng lớp trong tinh thần mới của kumbayaness kỹ thuật số. Mặc dù công nghệ thực sự đã đưa chúng ta đến với nhau theo những cách chưa từng có, nhưng nó cũng trao quyền cho những người ít quan tâm đến văn minh, nhưng có rất nhiều thời gian rảnh rỗi để phun ra một cách giận dữ, thực sự thiếu từ ALL-CAPS trên Internet.
Các phần bình luận từ khắp nơi trên Web cộng hưởng với các cuộc gọi của "GAY !!!, " "LIBTARD !!!!, " "NAZI !!!, " và "RON PAUL 2016 !!!!" Vì đây là cách Internet tranh luận về các vấn đề cấp bách trong ngày. (Và chúng ta đừng quên các lý thuyết âm mưu cray cray mà dệt theo cách của họ vào các bài viết hoàn toàn không liên quan.)
Nhưng bạn có bao giờ tự hỏi cộng đồng Internet nào thiếu kỹ năng giao tiếp nhất không? Chắc chắn, bạn có ý kiến về vấn đề này. Tất cả chúng ta có thể đặt tên cho ít nhất một trang web khi chúng ta nghĩ về những người đó .
"Máy tính khả năng đọc" trên Online-utility.org chỉ định điểm số theo một số bài kiểm tra khả năng đọc khác nhau, chẳng hạn như Chỉ số sương mù Gunning.
Những điểm số này là kết quả của các phương trình có yếu tố thuộc tính định lượng, chẳng hạn như số lượng từ, câu và âm tiết. Phương trình của Chỉ số Gunning trông như thế này:
Điểm số trùng với số năm giáo dục chính thức của Hoa Kỳ mà một người sẽ cần để dễ dàng hiểu văn bản. Vì vậy, điểm 12 sẽ chỉ ra rằng nó đáp ứng cấp độ đọc của một người nào đó ở lớp mười hai, trong khi điểm 4 cho thấy văn bản ở cấp độ đọc của lớp bốn, v.v.
Để xem điều này có thể áp dụng cho Web như thế nào, chúng tôi đã lấy mẫu các phần bình luận của tám trang web phổ biến từ các góc khác nhau của Internet kỹ thuật số nói tiếng Anh: (được liệt kê ở đây theo thứ tự bảng chữ cái) CNN, Fox Nation, Gawker, New York Times, PCMag (vâng, chúng tôi bao gồm chính chúng tôi), Reddit, Đại Tây Dương và YouTube. Chúng tôi đã điều khiển họ thông qua Máy tính dễ đọc để theo đuổi những sự thật phũ phàng lạnh lùng như những người có những người bình luận thông minh và ngu ngốc nhất.
Những phát hiện có thể làm bạn ngạc nhiên.
Đầu tiên, lướt qua phương pháp của chúng tôi:
Đối với mỗi trang web được bao gồm trong khảo sát của chúng tôi, chúng tôi đã chọn ba câu chuyện được nhận xét cao để sử dụng làm tập dữ liệu. Khi có sẵn, chúng tôi đã chọn từ phần được bình luận nhiều nhất của trang web (hoặc từ một danh sách tương tự các câu chuyện "phổ biến nhất", một cái gì đó chỉ ra những phần này rất tích cực).
Tiếp theo, chúng tôi đã sao chép 50 bình luận hàng đầu từ mỗi câu chuyện vào một tài liệu Word. Sau đó, thông qua một loạt các thao tác tìm và thay thế phức tạp, chúng tôi đã tách văn bản nhận xét khỏi tất cả các mảnh vỡ của trang web bên ngoài như hình đại diện, tên người bình luận, chữ ký thời gian, v.v.
Sau đó, chúng tôi đã để lại một tài liệu chứa đầy văn bản thuần túy, không bị biến đổi do người dùng tạo như thế này:
Tiếp theo, chúng tôi đã kết hợp văn bản chưng cất thành một văn bản chính, chúng tôi đã thả vào "Máy tính dễ đọc".
Để làm ví dụ nhanh, chúng tôi đã phân tích chương đầu tiên của Moby Dick cổ điển của Herman Melville (có sẵn dưới dạng tài liệu thuộc phạm vi công cộng ở đây) và thấy nó ghi được điểm số dễ đọc sau đây.
Chỉ số sương mù súng: 12.02
Chỉ số Coleman-Liau: 8, 62
Cấp độ Flesch-Kincaid: 10.16
ARI (Chỉ số dễ đọc tự động): 9, 97
Chỉ số SMOG: 11, 33
Trong trường hợp này, điểm Sương mù chỉ ra rằng văn bản ở cấp độ đọc của một học sinh trung học. Đối với hầu hết các bài viết nhắm vào công chúng nói chung, các nhà ngôn ngữ học coi điểm số lý tưởng là khoảng 7 hoặc 8.
Phần còn lại của các Chỉ số (mỗi phương thức sử dụng các phương trình khác nhau để tính điểm của nó) thấy rằng người ta có thể cần bất cứ nơi nào giữa giáo dục lớp tám và lớp 11 để dễ dàng kiểm tra Moby Dick .
Hiểu rồi? OK, đọc tiếp để xem các trang web hàng đầu của Web ghi điểm như thế nào.
Tiếp tục đọc: Vào danh sách>