Video: Report: NSA can indeed monitor you online (Tháng mười một 2024)
Nếu bạn tập trung một chút vào công nghệ đằng sau XKeyscore - chương trình chính phủ có mục đích được NSA sử dụng để ngăn chặn những kẻ khủng bố - thay vì chính trị, thì nó thực sự khá phiền phức. Một số báo cáo ước tính rằng chương trình XKeyscore có thể xử lý tới 41 tỷ bản ghi.
Trọng tâm của XKeyscore là hai xu hướng công nghệ chính: Dữ liệu lớn và Phân tích dữ liệu. Và không chỉ chính phủ mới háo hức đón nhận loại công nghệ này. Thông tin là mặt hàng nóng nhất hiện có. Dưới đây là một cái nhìn về những gì có thể nằm dưới vỏ bọc cho đến khi có thông số kỹ thuật với một chương trình như XKeyscore, dựa trên những gì các công ty đang thu thập và phân tích cùng một bộ dữ liệu lớn đang sử dụng và nhận xét từ các nhà cung cấp giúp các công ty này di chuyển dữ liệu đó.
Công nghệ đáng kinh ngạc
Dữ liệu lớn đề cập đến việc thu thập các tập dữ liệu lớn đến mức cần có công nghệ chuyên dụng để sàng lọc, phân tích và báo cáo chống lại thông tin đó. Tóm lại, Data Analytics là quá trình chia nhỏ thông tin đó thành các ngăn gọn gàng để có thể xem xét kỹ hơn.
Bộ sưu tập và phân tích dữ liệu rộng lớn này được sử dụng chủ yếu ở đâu? Trong công nghiệp tư nhân. Melissa Kolodziej, giám đốc truyền thông tiếp thị tại Attunity, một công ty giải pháp giúp doanh nghiệp truy cập và di chuyển khối lượng dữ liệu lớn, cho biết trong ngành bán lẻ, các công ty sẽ lấy và "tập hợp số lượng lớn dữ liệu" để phân tích thói quen của khách hàng chi tiết cụ thể như thấy "nếu người này chỉ mua dầu gội đầu để họ có thể cung cấp cho khách hàng đó một phiếu giảm giá có liên quan trên điện thoại di động của họ trong khi họ vẫn ở trong cửa hàng." Kolodziej cho biết các công ty muốn và có thể có "khả năng gần thời gian thực" khi phân tích các bộ dữ liệu lớn này và mong muốn loại bỏ thông tin nhanh nhất có thể.
Cụ thể công nghệ gây ngạc nhiên
Không có chi tiết thực sự có sẵn trên công nghệ cụ thể có thể được sử dụng với XKeyscore, ngoại trừ thực tế là nó liên quan đến 700 máy chủ Linux được đặt trên toàn cầu. Nhưng có thể phỏng đoán loại phần cứng cần thiết để tổng hợp và quản lý các bộ dữ liệu lớn này. Chỉ có một vài nhà cung cấp làm cho các loại máy có thể xử lý sức mạnh xử lý đáng kinh ngạc như vậy: Oracle, HP, IBM và EMC là những máy được nhắc đến nhiều nhất.
Tất nhiên, nó không chỉ là thương hiệu sắt trung tâm dữ liệu giúp thu thập và phân tích lượng dữ liệu khổng lồ.
"Đổi mới công nghệ trong phần cứng (dung lượng & tốc độ bộ nhớ, đa lõi, multiCPU) và phần mềm (cơ sở dữ liệu cột, hệ thống tệp cụm và vv) đã giúp có thể 'lưu trữ' lượng dữ liệu gần như không giới hạn", theo Byron Banks, phó chủ tịch cơ sở dữ liệu & công nghệ tại SAP.
Xử lý song song, những tiến bộ về sức mạnh tính toán thô, cũng như dung lượng lưu trữ khổng lồ với chi phí thấp tương đối, đã giúp loại hình khai thác dữ liệu này dễ dàng hơn cho chính phủ, doanh nghiệp và thậm chí các doanh nghiệp cỡ trung bình. Lawrence Schwartz, phó chủ tịch tiếp thị, Attunity, nói rằng kho dữ liệu ngày nay, "nói chung được xây dựng để hỗ trợ terabyte dữ liệu."
Thực tế là có rất nhiều nguồn dữ liệu, tất cả đều được đan xen, cũng đã giúp phân tích và thu thập các tập dữ liệu lớn rất hấp dẫn cho ngành công nghiệp. "Tôi nghĩ mọi người luôn muốn tìm hiểu những gì với dữ liệu. Trong thập kỷ qua có rất nhiều nguồn thông tin, có rất nhiều thứ được kết nối với nhau. Chúng ta không có nhiều năm trước … sức mạnh tính toán quá lớn, bây giờ có cơ hội, "Schwartz nói.
Những thách thức kéo dài và tranh cãi rõ ràng
Trong khi công nghệ tiếp tục phát triển nhanh chóng trong việc hỗ trợ Dữ liệu lớn và phân tích dữ liệu đó, các thách thức vẫn còn.
Thông thường, các thực thể đang thu thập nhiều dữ liệu hơn mức họ có thể xử lý, theo Schwartz. Ngoài ra còn có "một sự thiếu hụt lớn các nhà khoa học dữ liệu" có sẵn để hiểu ý nghĩa của dữ liệu được thu thập này.
"Thách thức với nhiều giải pháp và kỹ thuật hiện có là họ không thể hiểu và xác định được thông tin hữu ích nào tồn tại trong các nhóm 0 và 1 khổng lồ này, sau đó phân tích và sử dụng nó một cách hiệu quả và kịp thời. Tại SAP, chúng tôi được tập trung vào các sáng kiến giúp loại bỏ sự phức tạp ra khỏi bối cảnh CNTT và cải thiện tốc độ và tính linh hoạt nhờ đó 'dữ liệu' có thể được chuyển thành 'thông tin' hữu ích và được gửi đến người dùng cuối hoặc ứng dụng ", Ngân hàng của SAP cho biết.
Sau đó là những lo ngại về an ninh. "Vì rất nhiều công ty dữ liệu và người tiêu dùng tiếp tục đẩy và lưu trữ trên đám mây, công chúng nên quan tâm đến các hoạt động bảo mật thông tin của các công ty có đám mây nắm giữ thông tin cá nhân của chúng tôi", Paige Leidig, phó chủ tịch cấp cao của CodesCloud nói. "Trong khi PRISM ngồi và theo dõi thông tin chảy qua các đám mây cụ thể, XKeyscore chủ động theo dõi bất kỳ người nào được cung cấp qua Internet từ các trang web được truy cập đến email được trao đổi với các bài đăng trên phương tiện truyền thông xã hội. Trong cả hai trường hợp, ai đó đang xem và biên dịch dữ liệu cá nhân mà không có sự đồng ý của chủ sở hữu dữ liệu - và đó là vấn đề riêng tư ngay cả khi động lực là an ninh quốc gia cho phúc lợi công cộng. "
Tuy nhiên, theo Leidig, nếu có bất cứ điều gì, các chương trình giám sát Internet này, "nêu bật sự phụ thuộc của chúng tôi vào đám mây ở cấp độ doanh nghiệp và người tiêu dùng." Về việc giữ an toàn dữ liệu hoặc ngăn chặn hành vi trộm cắp dữ liệu của tin tặc hoặc bên trong dân IT, Leidig khuyên rằng "cách tiếp cận tốt hơn là cho phép đám mây (và các ứng dụng sát thủ mà doanh nghiệp cần và người tiêu dùng yêu thích) bằng cách sử dụng mã hóa không thể phá vỡ để tranh giành Theo cách này, người dùng trái phép - cho dù là cơ quan tình báo hay kẻ trộm mạng - không thể sử dụng dữ liệu. Như một biện pháp kiểm soát bổ sung, cung cấp cho các doanh nghiệp - không phải nhà cung cấp đám mây - giữ các khóa mã hóa / giải mã.
Trong trường hợp có yêu cầu thông tin (thư NSA mà chúng tôi đã nghe rất nhiều), doanh nghiệp sẽ được thông báo và có thể làm việc trực tiếp với chính phủ thay vì bị bỏ qua và trong bóng tối rằng dữ liệu của khách hàng được truy cập mà không có sự đồng ý. Đó là mô hình theo đó nhà cung cấp đám mây nắm giữ chìa khóa, bàn giao dữ liệu và bị pháp luật ngăn chặn tiết lộ yêu cầu thông tin cho doanh nghiệp. "
Rõ ràng, cuộc thảo luận lớn hiện nay trong công chúng chỉ là vì công nghệ ở đó để thu thập và phân tích dữ liệu khổng lồ, điều này có cấp phép cho chính phủ và doanh nghiệp sử dụng công nghệ đó cho người dân và khách hàng không? Đó là một cuộc tranh luận chắc chắn sẽ tiếp tục trong một thời gian dài.
Để biết thêm, hãy xem Xkeyscore không theo dõi bạn, đó là Google cho dữ liệu bị chặn của NSA.