Trang Chủ Ý kiến Dữ liệu lớn chỉ là một scam lớn | John c. nỗ lực

Dữ liệu lớn chỉ là một scam lớn | John c. nỗ lực

Video: SÆ° tá» cái vồ gọn trâu con giữa đàn (Tháng Chín 2024)

Video: SÆ° tá» cái vồ gọn trâu con giữa đàn (Tháng Chín 2024)
Anonim

Meme "dữ liệu lớn" mới xuất hiện chưa bao giờ được định nghĩa theo bất kỳ cách có ý nghĩa và dứt khoát nào. Đó là thuật ngữ buzz vô định hình mới nhất mà tôi đã thấy trong một thập kỷ. Đó là một trong những thuật ngữ "con mắt của kẻ si tình" được sử dụng để làm sinh động một cuộc hội thảo và cuối cùng khiến các nhà đầu tư đắm chìm.

Hãy bắt đầu bằng cách hỏi dữ liệu lớn có nghĩa là gì? Rất nhiều dữ liệu? Nhiều dữ liệu hơn bạn có thể xử lý? Dữ liệu vô định hình? Mất kiểm soát dữ liệu? Dữ liệu hữu ích để phân tích? Dữ liệu vô dụng? Quá tải thông tin?

Nếu bạn đọc đủ về dữ liệu lớn, đó là tất cả những điều trên và hơn thế nữa. Chìa khóa không phải là dữ liệu, mà là thách thức về cách xử lý dữ liệu và phải làm gì với chính dữ liệu đó.

Nói cách khác, làm thế nào chúng ta có thể tạo ra đống dữ liệu khổng lồ này mà chúng ta đã tích lũy được, có ích theo những cách mới và có lợi nhuận? Các nhóm dữ liệu có thể đến từ bất cứ đâu thông qua các cơ chế tính toán khác nhau như bài đăng trên Facebook, nhật ký NSA, danh sách gửi thư, khách hàng, v.v.

Tôi sẽ lập luận rằng hầu hết các độc giả của cột này là kho lưu trữ dữ liệu lớn. Tôi vừa mua một ổ đĩa 3 Terabyte để sao lưu. Tôi có rất nhiều dữ liệu để sao lưu! Dữ liệu lớn!

Một công cụ hữu ích mà tôi có thể tưởng tượng sẽ là một công cụ phân tích dữ liệu lớn mà cảnh sát có thể sử dụng để tìm ra bạn phạm tội ngẫu nhiên bằng cách xem qua các tập tin của bạn. Hoặc ít nhất là tìm một cái gì đó sẽ làm bạn bối rối. Dữ liệu lớn!

Tất cả điều này trở lại với một nhận xét được đưa ra bởi một cựu CEO của American Express, người đã nói với khán giả rằng nếu công ty muốn (và điều này áp dụng cho tất cả các công ty thẻ tín dụng), họ có thể sử dụng thói quen và xu hướng mua hàng cá nhân của bạn để hoàn thiện hồ sơ và chắc chắn cho biết nếu bạn đang ngoại tình hay không. Dữ liệu lớn!

Từ những gì tôi có thể nói, đây chính xác là những gì dữ liệu lớn làm tốt nhất, theo dõi các cá nhân.

Bình luận phổ biến của ngành công nghiệp là bằng cách nào đó cơ sở dữ liệu khổng lồ chứa thông tin về bạn sẽ được sử dụng vì lợi ích của bạn. Vâng, bạn biết đấy, vì vậy bạn sẽ nhận được những thứ bạn thực sự quan tâm. Quảng cáo được nhắm mục tiêu. Điều này có lợi cho tất cả mọi người!

Đây là cách nó hoạt động. Tôi quan tâm đến việc mua một máy ảnh mới và nghe về Bogus One mới. Tôi đọc một bài viết trên PCMag.com về máy ảnh, sau đó tôi đến Amazon và kiểm tra giá cả và đánh giá của người dùng. Nó xuất hiện như thể không ai thích máy ảnh. Đó là một mảnh rõ ràng của crap. Các nhà phê bình đều xa lánh máy ảnh. Người mua ghét máy ảnh. Đây không phải là một máy ảnh tôi muốn. Nhưng phần mềm phân tích dữ liệu lớn quyết định cung cấp cho tôi hàng trăm quảng cáo, trên mỗi trang web tôi truy cập, tất cả đều hiển thị máy ảnh Bogus One. Dữ liệu lớn!

Tệ hơn thế. Nếu mọi thứ đi theo hướng khác và tôi quyết định tôi thích và muốn máy ảnh và thực sự đã mua máy ảnh, tôi vẫn nhận được quảng cáo khuyến khích tôi mua máy ảnh. Dữ liệu lớn!

Quảng cáo "dữ liệu lớn" được nhắm mục tiêu là tải trọng lớn nhất của baloney, từ trước đến nay.

OK, vì vậy, hãy quên fiasco và chuyển sang sử dụng dữ liệu lớn cho xu hướng. Dữ liệu lớn có thể tìm thấy nhiều kim trong các đống cỏ khác nhau. Vì vậy, bạn sẽ nhận được một cái gì đó như thế này: Bốn mươi phần trăm tất cả người mua Subaru là người ăn chay / thuần chay và 80 phần trăm trong số họ là đảng Dân chủ. Nhưng con số đó tăng lên lần lượt là 60% và 90%, nếu chúng ta đang nói về Subaru Outback. Hơn nữa, nó tăng đến 99 phần trăm người ăn chay / thuần chay và 99 phần trăm Dân chủ nếu chiếc xe được sơn màu xanh lá cây.

Các nhà lý thuyết dữ liệu lớn sẽ có một ngày thực địa tại hội thảo với thông tin này. Nhưng nó bỏ qua tất cả các biến có thể thay đổi các tính toán và xu hướng, là vô tận. Bất kỳ dữ liệu lớn cụ thể nào này sẽ giữ được bao lâu nếu Giám đốc điều hành của Subaru lái xe đến một khu vực hẻo lánh màu xanh lá cây và tuyên bố rằng "Tất cả cá voi phải bị tiêu diệt!"?

Nó thậm chí không mất nhiều thời gian để thay đổi động lực của kết luận dữ liệu lớn. Bất chấp những gì anh chàng American Express nói, dữ liệu thực sự bị mù. Đó là lý do tại sao bạn nhận được quảng cáo cho các sản phẩm bạn đã mua.

Dữ liệu lớn sẽ có bạn nhảy đến kết luận.

Nếu ai đó mua mười cuốn sách về cách chế tạo bom, điều đó có nghĩa là anh ta muốn làm nổ tung Tòa nhà Liên bang? Điều gì sẽ xảy ra nếu anh ta là một chuyên gia xử lý bom và điều đó không được bao gồm trong chức danh của anh ta với tư cách là cố vấn cảnh sát? Dữ liệu lớn không thể biết tất cả mọi thứ, chưa. Nó không thể biết bạn đang nghĩ gì. Tôi đang suy nghĩ, ví dụ, máy ảnh Bogus One hút. Dữ liệu lớn không thể biết điều đó trừ khi tôi bị thẩm vấn. Và tôi có thể nói dối về nó.

Không ai trong số này nghe có vẻ tốt hoặc lành mạnh cho xã hội. Nhảy đến kết luận, đưa ra các giả định, hành động dựa trên các giả định sai. Hound công chúng với s vô dụng.

Dữ liệu lớn như một khái niệm cao sẽ không bao giờ tự xác định đầy đủ và chết một cái chết khốn khổ. Tôi hi vọng.

Dữ liệu lớn chỉ là một scam lớn | John c. nỗ lực