Trang Chủ Kinh doanh Ai cơ sở dữ liệu: chúng là gì và tại sao doanh nghiệp của bạn nên quan tâm

Ai cơ sở dữ liệu: chúng là gì và tại sao doanh nghiệp của bạn nên quan tâm

Mục lục:

Video: QUẦN BỎ BỈM có CẦN THIẾT ? | Đánh giá quần bỏ bỉm Goodmama | Review Bỉm Vải (Tháng Chín 2024)

Video: QUẦN BỎ BỈM có CẦN THIẾT ? | Đánh giá quần bỏ bỉm Goodmama | Review Bỉm Vải (Tháng Chín 2024)
Anonim

Dữ liệu và kinh doanh thông minh (BI) là hai mặt của cùng một đồng tiền. Những tiến bộ trong lưu trữ, xử lý và phân tích đã đưa dữ liệu dân chủ hóa đến mức bạn không cần phải là một chuyên gia cơ sở dữ liệu hoặc nhà khoa học dữ liệu để làm việc với các tập dữ liệu lớn và rút ra những hiểu biết sâu sắc. Vẫn còn một đường cong học tập, nhưng BI tự phục vụ và các công cụ trực quan hóa dữ liệu đang định nghĩa lại cách các doanh nghiệp tận dụng tất cả dữ liệu họ thu thập thành các phân tích hành động. Tuy nhiên, có một sự khác biệt giữa BI hoặc công ty cơ sở dữ liệu bao gồm phân tích nâng cao và cơ sở dữ liệu trí tuệ nhân tạo (AI) được xây dựng nhằm mục đích đào tạo máy học (ML) và mô hình học sâu.

Các thuật toán ML đang được dệt thành phần lớn của phần mềm ngày nay. Trải nghiệm của người tiêu dùng đang kết hợp với AI thông qua trợ lý ảo và, trong phần mềm kinh doanh, có những ví dụ như Salesforce Einstein hoạt động như một lớp thông minh bên dưới danh mục quản lý quan hệ khách hàng (CRM) của công ty. Những người khổng lồ công nghệ, bao gồm Google và Microsoft, đang đẩy tương lai thông minh của chúng ta đi xa hơn, không chỉ bằng nghiên cứu mà bằng cách viết lại cách thức công nghệ của họ hoạt động từ nền tảng với AI.

Một trong những thách thức với máy đào tạo và mô hình học sâu là khối lượng dữ liệu và sức mạnh xử lý tuyệt đối mà bạn cần để đào tạo một mạng lưới thần kinh, ví dụ, về nhận dạng mẫu phức tạp trong các lĩnh vực như phân loại hình ảnh hoặc xử lý ngôn ngữ tự nhiên (NLP). Do đó, cơ sở dữ liệu AI đang bắt đầu xuất hiện trên thị trường như một cách để tối ưu hóa quá trình học tập và đào tạo AI cho các doanh nghiệp. Chúng tôi đã nói chuyện với nhà cung cấp cơ sở dữ liệu quan hệ được tăng tốc GPU Kinetica, công ty đã xây dựng cơ sở dữ liệu AI của riêng mình, và chuyên gia cơ sở dữ liệu BI và PC thường trú của PCMag, Pam Baker để làm sáng tỏ cơ sở dữ liệu AI là gì và cách thức hoạt động so với cơ sở dữ liệu truyền thống. Quan trọng hơn, chúng tôi đã yêu cầu sự giúp đỡ của họ để sắp xếp thông qua quảng cáo và tiếp thị để xác định liệu công nghệ mới nổi này có giá trị kinh doanh thực sự hay không.

Cơ sở dữ liệu AI là gì?

Bản chất thay đổi nhanh chóng của không gian AI có thể gây khó khăn cho việc thiết lập thuật ngữ. Bạn thường nghe thấy các thuật ngữ như ML, học sâu và AI được sử dụng thay thế cho nhau, trên thực tế, chúng vẫn là các kỹ thuật phát triển dưới cái ô lớn hơn của AI. Như vậy, Baker cho biết có hai định nghĩa rất khác nhau về cơ sở dữ liệu AI là gì tùy thuộc vào người bạn nói chuyện: một người thực tế và người khác thực tế hơn.

"Có một sự đồng thuận lỏng lẻo trong ngành rằng cơ sở dữ liệu AI sẽ là cơ sở hoàn toàn không hoạt động với các truy vấn ngôn ngữ tự nhiên. Giao diện người dùng sẽ không phải dựa vào thuật ngữ tìm kiếm và cụm từ chính để tìm thông tin bạn cần, cho phép người dùng triệu tập các tập dữ liệu bằng NLP, "Baker nói. "Bạn có thể đưa ra một lập luận rất hạn chế rằng IBM Watson có thể đặt ra các truy vấn ngôn ngữ tự nhiên cho hệ thống, nhưng bạn phải kết nối với dữ liệu và tự mình chọn dữ liệu. Vì vậy, ngay bây giờ, định nghĩa đó là một sự kéo dài."

Định nghĩa thực tế hơn, và chủ đề của người giải thích này, về cơ bản là sử dụng cơ sở dữ liệu được xây dựng có mục đích để tăng tốc độ đào tạo mô hình ML. Một số công ty công nghệ đã phát triển chip AI chuyên dụng để giảm tải xử lý nặng cho các sản phẩm phần cứng mới khi các nhà cung cấp tung ra nhiều tính năng dựa trên AI đòi hỏi sức mạnh tính toán đáng kể. Về mặt dữ liệu, sử dụng cơ sở dữ liệu AI có thể giúp bạn cải thiện tốt hơn khối lượng, vận tốc và các thách thức quản trị và quản lý dữ liệu phức tạp liên quan đến đào tạo ML và các mô hình học sâu để tiết kiệm thời gian và tối ưu hóa tài nguyên.

Tín dụng hình ảnh: Todd Jaquith tại Futurism.com. Nhấn vào đây để mở rộng infographic

"Ngay bây giờ có rất nhiều nỗ lực để tăng tốc đào tạo ML thông qua một số chiến thuật khác nhau, " Baker giải thích. "Một là tách cơ sở hạ tầng khỏi các nhà nghiên cứu AI thực hiện mã hóa, để các chức năng tự động xử lý cơ sở hạ tầng và đào tạo mô hình ML. Vì vậy, thay vì dành thời gian như ba tháng, bạn có thể xem xét 30 ngày hoặc 30 phút. "

Kinetica chia ý tưởng đó thành một nền tảng cơ sở dữ liệu tích hợp được tối ưu hóa cho ML và mô hình hóa học tập sâu. Cơ sở dữ liệu AI kết hợp lưu trữ dữ liệu, phân tích nâng cao và trực quan hóa trong cơ sở dữ liệu trong bộ nhớ. Mate Radalj, Phó Chủ tịch và Kỹ sư phần mềm chính của Tập đoàn Công nghệ tiên tiến Kinetica, giải thích rằng cơ sở dữ liệu AI có thể đồng thời nhập, khám phá, phân tích và trực quan hóa dữ liệu phức tạp, di chuyển nhanh trong một phần nghìn giây. Mục tiêu là giảm chi phí, tạo doanh thu mới và tích hợp các mô hình ML để doanh nghiệp có thể đưa ra các quyết định dựa trên dữ liệu hiệu quả hơn.

"Cơ sở dữ liệu AI là tập hợp con của cơ sở dữ liệu chung, " Radalj nói. "Hiện tại, cơ sở dữ liệu AI rất phổ biến. Nhưng rất nhiều giải pháp sử dụng các thành phần phân tán. Spark, MapReduce và HDFS luôn quay vòng qua lại thay vì trong bộ nhớ. Chúng không có sự kết hợp của các yếu tố như cơ sở dữ liệu của chúng tôi. được xây dựng từ nền tảng với CPU và GPU tích hợp chặt chẽ trên một nền tảng duy nhất. Lợi ích cấp cao đối với chúng tôi là cung cấp nhanh hơn và cơ sở đào tạo dựa trên mô hình thấp hơn, với sự quay vòng và phân tích nhanh được tích hợp vào cùng một nền tảng. "

Cơ sở dữ liệu AI hoạt động như thế nào

Có một số ví dụ về cơ sở dữ liệu AI trong thực tế. Microsoft Batch AI cung cấp cơ sở hạ tầng dựa trên đám mây để đào tạo các mô hình ML học tập sâu và chạy trên GPU Microsoft Azure. Công ty cũng có sản phẩm Azure Data Lake để giúp các doanh nghiệp và nhà khoa học dữ liệu dễ dàng xử lý và phân tích dữ liệu trên một kiến ​​trúc phân tán.

Một ví dụ khác là cách tiếp cận AutoML của Google, về cơ bản là tái thiết kế theo cách các mô hình ML được đào tạo. Google AutoML tự động hóa thiết kế mô hình ML để tạo các kiến ​​trúc mạng thần kinh mới dựa trên các bộ dữ liệu cụ thể, sau đó kiểm tra và lặp lại hàng ngàn lần đó để mã hóa các hệ thống tốt hơn. Trên thực tế, AI của Google giờ đây có thể tạo ra các mô hình tốt hơn các nhà nghiên cứu của con người.

"Hãy xem Google AutoML: ML viết mã ML để bạn thậm chí không cần người", Baker nói. "Điều này cho bạn ý tưởng về sự khác biệt cực lớn trong những gì các nhà cung cấp đang làm. Một số người đang cố gắng loại bỏ các phân tích nâng cao như ML, và không phải vậy. Và những người khác đang làm ML ở cấp độ nâng cao vượt xa hầu hết những gì doanh nghiệp có thể hiểu vào lúc này. "

Rồi còn Kinetica. Công ty khởi nghiệp có trụ sở tại San Francisco, đã huy động được 63 triệu đô la vốn đầu tư mạo hiểm (VC), cung cấp cơ sở dữ liệu SQL hiệu suất cao được tối ưu hóa để nhập dữ liệu và phân tích nhanh. Kinetica là những gì Radalj mô tả như là một cơ sở dữ liệu và nền tảng phân tán xử lý song song (MPP) trong đó mọi nút đều có cùng dữ liệu trong bộ nhớ, CPU và GPU.

Điều gì làm cho một cơ sở dữ liệu AI khác với cơ sở dữ liệu truyền thống, Radalj giải thích, có ba yếu tố cốt lõi:

  • Nhập dữ liệu nhanh,
  • Đồng địa phương của dữ liệu trong bộ nhớ (xử lý song song giữa các nút cơ sở dữ liệu) và
  • Một nền tảng chung cho các nhà khoa học dữ liệu, kỹ sư phần mềm và quản trị viên cơ sở dữ liệu để lặp lại và kiểm tra các mô hình nhanh hơn và áp dụng kết quả trực tiếp vào phân tích.

Đối với tất cả các chuyên gia đào tạo mô hình AI và cơ sở dữ liệu không đọc điều này, Radalj đã chia nhỏ từng yếu tố cốt lõi này và giải thích cách cơ sở dữ liệu AI liên kết với giá trị kinh doanh hữu hình. Tính khả dụng của dữ liệu và nhập dữ liệu là chìa khóa, theo ông, bởi vì khả năng xử lý dữ liệu truyền phát theo thời gian thực cho phép các doanh nghiệp thực hiện nhanh chóng các hiểu biết do AI điều khiển.

"Chúng tôi có một khách hàng bán lẻ muốn theo dõi giá bán theo cửa hàng, cứ năm phút một lần, " Radalj nói. "Chúng tôi muốn sử dụng AI để dự báo, dựa trên vài giờ cuối cùng của dữ liệu lịch sử, liệu họ có nên bổ sung hàng tồn kho và tối ưu hóa quy trình đó hay không. Nhưng để thực hiện việc bổ sung hàng tồn kho do máy điều khiển, cần phải hỗ trợ 600-1200 truy vấn mỗi giây. Đây là cơ sở dữ liệu SQL và cơ sở dữ liệu AI, vì vậy chúng tôi có thể nhập dữ liệu với tốc độ đó. Chúng tôi đáp ứng nhiệm vụ kinh doanh đó dẫn đến một ứng dụng mang lại nhiều ROI hơn. "

Baker đồng ý rằng ML yêu cầu một lượng lớn dữ liệu nên việc nhập dữ liệu nhanh chóng sẽ rất quan trọng đối với cơ sở dữ liệu AI. Yếu tố thứ hai, khái niệm "đồng địa phương của dữ liệu trong bộ nhớ", cần giải thích thêm một chút. Cơ sở dữ liệu trong bộ nhớ lưu trữ dữ liệu trong bộ nhớ chính thay vì lưu trữ đĩa riêng biệt. Nó làm như vậy để xử lý các truy vấn nhanh hơn, đặc biệt là trong cơ sở dữ liệu phân tích và BI. Theo đồng địa phương, Radalj giải thích rằng Kinetica không tách rời các nút tính toán CPU và GPU so với các nút lưu trữ.

Do đó, cơ sở dữ liệu AI hỗ trợ xử lý song song, mô phỏng khả năng xử lý nhiều kích thích của bộ não con người trong khi cơ sở dữ liệu có thể mở rộng. Điều này ngăn chặn dấu chân phần cứng lớn hơn, xuất phát từ cái mà Radalj gọi là "vận chuyển dữ liệu" hoặc nhu cầu gửi dữ liệu qua lại giữa các thành phần cơ sở dữ liệu khác nhau.

Radalj nói: "Một số giải pháp sử dụng một dàn nhạc như Symphony của IBM để sắp xếp công việc trên nhiều thành phần khác nhau trong khi Kinetica nhấn mạnh chức năng vận chuyển đối với các tài nguyên cùng vị trí, với tối ưu hóa nâng cao để giảm thiểu vận chuyển dữ liệu". "Đồng địa phương đó cho vay với hiệu suất và thông lượng vượt trội, đặc biệt đối với truy vấn nặng đồng thời cao trên các tập dữ liệu lớn."

Về phần cứng cơ sở dữ liệu thực tế, Kinetica hợp tác với Nvidia, công ty có một dòng GPU AI mở rộng và đang khám phá các cơ hội với Intel. Radalj cũng cho biết công ty đang để mắt đến cơ sở hạ tầng dựa trên đám mây và phần cứng AI mới nổi như Bộ xử lý kéo căng (TPU) của Google.

Cuối cùng, có ý tưởng về một quy trình đào tạo mô hình thống nhất. Cơ sở dữ liệu AI chỉ hiệu quả nếu những lợi ích của việc nhập và xử lý nhanh hơn phục vụ các mục tiêu định hướng kinh doanh lớn hơn cho ML của công ty và nỗ lực học tập sâu. Radalj gọi cơ sở dữ liệu AI của Kinetica như là một "nền tảng đường ống mô hình" thực hiện lưu trữ mô hình theo định hướng khoa học dữ liệu.

Tất cả điều này cho vay để thử nghiệm và lặp lại nhanh hơn để phát triển các mô hình ML chính xác hơn. Về điểm này, Baker cho biết việc hợp tác theo cách thống nhất có thể giúp tất cả các kỹ sư và nhà nghiên cứu làm việc để đào tạo mô hình ML hoặc học sâu lặp lại nhanh hơn bằng cách kết hợp những gì hoạt động, trái ngược với việc tiếp tục phát minh lại tất cả các bước trong quy trình đào tạo. Radalj cho biết mục tiêu là tạo ra một quy trình công việc trong đó việc nhập hàng loạt, truyền phát và truy vấn nhanh hơn tạo ra kết quả mô hình có thể được áp dụng ngay lập tức cho BI.

Radalj nói: "Các nhà khoa học dữ liệu, kỹ sư phần mềm và quản trị viên cơ sở dữ liệu có một nền tảng duy nhất nơi công việc có thể được phân định rõ ràng trên chính khoa học dữ liệu, viết chương trình phần mềm và các mô hình và truy vấn dữ liệu SQL". "Mọi người làm việc với nhau sạch sẽ hơn trong các lĩnh vực khác nhau khi đó là một nền tảng chung. Mục tiêu thường xuyên hơn là không chạy ML và học sâu là, bạn muốn sử dụng kết quả của điều đó, các đồng hiệu quả và biến số kết hợp với phân tích và sử dụng đầu ra cho những thứ như ghi điểm hoặc dự đoán thứ gì đó hữu ích. "

Sự cường điệu hay hiện thực?

Giá trị dòng dưới cùng của cơ sở dữ liệu AI, ít nhất là theo cách Kinetica định nghĩa nó, là tối ưu hóa tài nguyên tính toán và cơ sở dữ liệu. Điều này, đến lượt nó, cho phép bạn tạo ML tốt hơn và các mô hình học sâu, đào tạo chúng nhanh hơn và hiệu quả hơn và duy trì thông qua cách AI sẽ được áp dụng cho doanh nghiệp của bạn.

Radalj đã đưa ra ví dụ về một công ty quản lý đội xe hoặc vận tải. Trong trường hợp này, cơ sở dữ liệu AI có thể xử lý luồng thông tin thời gian thực khổng lồ từ một đội xe. Sau đó, bằng cách mô hình hóa dữ liệu không gian địa lý đó và kết hợp nó với các phân tích, cơ sở dữ liệu có thể tự động định tuyến lại các xe tải và tối ưu hóa các tuyến đường.

"Dễ dàng cung cấp nhanh hơn, nguyên mẫu và thử nghiệm. Từ 'mô hình hóa' được đưa ra trong AI, nhưng tất cả chỉ là về việc đi xe đạp qua các cách tiếp cận khác nhau, càng nhiều dữ liệu, càng tốt, họ chạy chúng nhiều lần, thử nghiệm, so sánh và sắp tới với những mô hình tốt nhất ", Radalj nói. "Mạng lưới thần kinh đã được ban sự sống vì có nhiều dữ liệu hơn bao giờ hết. Và chúng tôi đang học cách có thể tính toán thông qua nó."

Cuối cùng, cơ sở dữ liệu đồng thời và cơ sở dữ liệu mô hình cùng vị trí của Kinetica chỉ là một cách tiếp cận trong một không gian có thể có nhiều ý nghĩa khác nhau tùy thuộc vào người bạn hỏi. Baker cho biết thách thức đối với người mua trong một thị trường vẫn đang phát triển và thử nghiệm là tìm ra chính xác những gì một nhà cung cấp cơ sở dữ liệu AI đang đưa ra.

"Là một khái niệm kinh doanh, học tập sâu, ML, và tất cả đó là một khái niệm vững chắc. Những gì chúng tôi đang giải quyết là các vấn đề công nghệ có thể giải quyết được, ngay cả khi chúng tôi chưa giải quyết chúng", Baker nói. "Điều đó không có nghĩa là đây là một không gian trưởng thành bởi vì nó chắc chắn là không. Tôi sẽ nói 'người mua hãy cẩn thận' bởi vì thứ gì đó được gọi là ML có thể hoặc không. Nó có thể chỉ là phân tích nâng cao trong khu vườn."

Về việc liệu các cơ sở dữ liệu AI có phải là sự cường điệu ngay bây giờ hay liệu chúng có đại diện cho một xu hướng quan trọng cho việc kinh doanh đang diễn ra hay không, Baker cho biết đó là một chút của cả hai. Cô cho biết Big Data, như một thuật ngữ tiếp thị, hiện không còn được ưa chuộng. Baker cho biết hiện đã có một số sự kết hợp thị trường giữa các phân tích dựa trên dữ liệu tiên tiến và ML thực sự và các thuật toán học sâu. Bất kể, cho dù bạn đang nói về một cơ sở dữ liệu cho mô hình ML hoặc các AI tự nhận thức được mơ ước bởi văn hóa pop, tất cả đều bắt đầu và kết thúc bằng dữ liệu.

"Dữ liệu sẽ được sử dụng trong kinh doanh cho đến khi thời gian kết thúc; đó chỉ là trọng tâm trong hoạt động kinh doanh", Baker nói. "Khi bạn nói về mặt khoa học viễn tưởng, AI là một trí thông minh tự nhận thức. Đó là khi bạn bắt đầu nói về những điểm kỳ dị và robot chiếm lĩnh thế giới. Dù điều đó có xảy ra hay không, tôi không biết. điều đó với Stephen Hawking. "

Ai cơ sở dữ liệu: chúng là gì và tại sao doanh nghiệp của bạn nên quan tâm