Trang Chủ Kinh doanh 7 lời khuyên cho sự thành công của máy học

7 lời khuyên cho sự thành công của máy học

Mục lục:

Video: ALIBABA - Bé Tú Anh | Nhạc Thiếu Nhi [MV Official] (Tháng Chín 2024)

Video: ALIBABA - Bé Tú Anh | Nhạc Thiếu Nhi [MV Official] (Tháng Chín 2024)
Anonim

Phần đầu tiên của Hướng dẫn kinh doanh về học máy (ML) của chúng tôi đã phá vỡ cách khái niệm ô của ML mang nhiều sắc thái hơn trong môi trường kinh doanh. Các chiến lược hiệu quả nhất nhìn vào ML theo nghĩa thực tế, sử dụng cả các kỹ thuật "học giá rẻ" phức tạp và ít chuyên sâu để tối ưu hóa các quy trình của doanh nghiệp và hiểu biết sâu sắc về kinh doanh hữu hình (BI).

Mục tiêu của việc triển khai ML trong các ứng dụng kinh doanh của bạn là cải thiện điểm mấu chốt của bạn hoặc nhấn vào lợi thế cạnh tranh của công ty bạn. Nhưng trong sơ đồ lớn hơn của tổ chức của bạn, việc tận dụng tối đa thời gian và nguồn lực bạn đầu tư vào quá trình này vượt xa các thuật toán. Những người ra quyết định CNTT trong doanh nghiệp của bạn cần đảm bảo mọi thứ bao gồm cả việc bổ sung ML của bạn từ dữ liệu và hậu cần cho đến cách bạn gắn kết với người dùng, phối hợp với nhau để tối đa hóa hiệu quả.

Ted Dunning, Tiến sĩ, là Kiến trúc sư ứng dụng trưởng tại MapR, một công ty phần mềm doanh nghiệp cung cấp các công cụ quản lý dữ liệu và phân phối Big Data khác nhau. Dunning cũng là đồng tác giả của hai cuốn sách về cái mà ông gọi là "Học máy thực tế" và phát triển công nghệ ML cho một số công ty trong nhiều năm qua, bao gồm hệ thống phát hiện gian lận ID Analytics (được LifeLock mua) và phần mềm Musicmatch Jukebox, mà sau này trở thành Yahoo Music. Ông hiện cũng là Phó chủ tịch ươm tạo cho Quỹ phần mềm Apache.

Dunning đã theo dõi không gian ML phát triển qua nhiều thập kỷ và học được rất nhiều về những gì hoạt động và những gì không có trong môi trường kinh doanh thực tế. Dưới đây, Dunning đưa ra bảy thực tiễn tốt nhất để tuân theo khi phát triển các giải pháp kinh doanh bắt nguồn từ ML.

1. Đừng quên Logistics

ML thành công không chỉ là về việc chọn đúng công cụ hoặc thuật toán. Dunning cho biết bạn cũng cần tìm ra cách tiếp cận nào phù hợp và thiết kế nó cho tình huống cụ thể mà bạn đang giải quyết. Ví dụ, Dunning đã nói về ML trong một chiến dịch tiếp thị trực tuyến trái ngược với các kịch bản phức tạp hơn nhiều như thuật toán hướng dẫn một chiếc xe tự trị. Chi phí tài nguyên của bạn cho một cải tiến thuật toán gia tăng là giá trị rắc rối cho chiếc xe, nhưng trong kịch bản tiếp thị, bạn sẽ thấy lợi nhuận tốt hơn nhiều từ việc tối ưu hóa tất cả các hậu cần xung quanh nó.

"Thông thường, đối với các doanh nghiệp, đó là hậu cần, không phải học tập, mang lại cho bạn giá trị. Đó là phần bạn nên dành thời gian và nguồn lực của mình", Dunning nói. "Điều chỉnh thuật toán sẽ mang lại cho bạn một cải tiến nhỏ. Nhưng điều chỉnh dữ liệu đó, GUI và cách bạn lắng nghe và thu hút người dùng có thể dễ dàng cải thiện 100%. Dành thời gian để điều chỉnh thuật toán có giá trị như một phần nhỏ nhiều cho các doanh nghiệp như đang lắng nghe người dùng của bạn. "

Để minh họa điểm này, Dunning đã giải thích cách anh ta từng xây dựng một mô hình để xác định gian lận ứng dụng (mở tài khoản giả với danh tính bị đánh cắp) trong cơ sở dữ liệu khách hàng của công ty. Mô hình mà ông xây dựng đã đạt được kết quả tuyệt vời, nhưng Dunning nhận thấy nó rất nặng nề về giới tính của người nộp đơn.

Hóa ra là hậu cần đã tắt. Cách thức hoạt động của quy trình nộp đơn, người nộp đơn chỉ điền vào giới tính của họ sau khi họ đã trở thành khách hàng và đã vượt qua một số bước sàng lọc để lọc những kẻ lừa đảo. Vì vậy, bằng cách sử dụng lĩnh vực giới tính, mô hình ML đã gian lận hậu cần của toàn bộ quá trình gian lận. Điều đó không liên quan gì đến thuật toán và mọi thứ liên quan đến cách công ty lấy dữ liệu ngay từ đầu.

2. Ghi nhớ dữ liệu của bạn

Dunning đầy những mẩu tin hấp dẫn của trí tuệ. Sau khi bắt đầu với "đó là hậu cần, không phải học tập", ông nói rằng nửa kia của ý tưởng đó là "đó là dữ liệu, không phải thuật toán." Một phần lớn trong việc đảm bảo các thuật toán ML của bạn đang cung cấp những hiểu biết có giá trị là đảm bảo bạn cung cấp cho chúng đúng dữ liệu. Dunning cho biết, nếu bạn không nhận được kết quả mà bạn đang tìm kiếm, thì thường xuyên hơn không phải vì bạn không sử dụng đúng dữ liệu.

Dunning nói: "Mọi người cảm thấy khó chịu và bị ràng buộc với các thuật toán cụ thể, nhưng ngày nay, vì các công cụ hiện có, mọi người và mẹ của họ có thể và đang tìm ra tất cả các loại thuật toán mới". "Dữ liệu quan trọng hơn nhiều và sẽ giúp bạn nâng cao hơn nhiều so với việc điều chỉnh thuật toán của bạn một cách vô tận. Nếu bạn đang làm việc với một vấn đề khó khăn như nhận dạng giọng nói hoặc thị giác máy tính, đó là một điều. Nhưng đây là trường điều khiển dữ liệu. Trong phần lớn các tình huống, bạn sẽ được hưởng lợi nhiều hơn từ việc điều chỉnh dữ liệu bạn nhận được và thay đổi câu hỏi. "

Đó là những gì Dunning đã làm vào giữa những năm 2000 khi xây dựng một công cụ đề xuất video tại một công ty có tên Veoh Networks. Nhóm đã làm việc để xác định các cặp video do người dùng tạo mà mọi người đã nhấp vào nhiều hơn mong đợi, nhưng thuật toán không hoạt động. Họ đã suy nghĩ về mặt âm nhạc, nơi người dùng biết các nghệ sĩ và bài hát yêu thích của họ theo tên. Vì vậy, họ đã thay đổi câu hỏi bằng cách điều chỉnh giao diện người dùng mà không cần chạm vào thuật toán.

"Trong các video do người dùng tạo, không ai biết các nghệ sĩ và rất nhiều video có các tiêu đề thực sự spam để có được nhiều lượt xem hơn. Đi xe đạp trên các chỉnh sửa thuật toán sẽ không bao giờ cho chúng tôi kết quả tốt", Dunning nói. "Những gì chúng tôi đã làm là thay đổi giao diện người dùng để phát tín hiệu đèn hiệu cứ sau 10 giây. Chúng tôi thấy rằng nếu chúng tôi sử dụng đèn hiệu thay vì nhấp vào dữ liệu thô của người giới thiệu, chúng tôi đã nhận được kết quả tuyệt vời. cải thiện trăm phần trăm trong sự tham gia do các khuyến nghị, không có thay đổi thuật toán. "

3. Thuật toán không phải là viên đạn ma thuật

ML triển khai phát triển trên thử nghiệm liên tục và lỗi. Cho dù thuật toán của bạn tốt đến đâu, nếu hệ thống của bạn tương tác với con người, thì nó sẽ cần phải được điều chỉnh theo thời gian. Dunning nhấn mạnh rằng các doanh nghiệp nên liên tục đo lường hiệu quả tổng thể của việc thực hiện và xác định các thay đổi và biến số đang làm cho nó tốt hơn và làm cho nó tồi tệ hơn. Điều này nghe có vẻ giống như một bình nguyên, nhưng Dunning nói, mặc dù nghe rõ ràng như thế nào, rất ít người đang làm điều này hoặc làm tốt.

"Rất nhiều người muốn triển khai một hệ thống hoặc thực hiện một số hành động và họ muốn thuật toán của họ chạy hoàn hảo mãi mãi, " Dunning nói. "Không có thuật toán nào sẽ là một viên đạn ma thuật. Không có thiết kế giao diện người dùng nào sẽ tồn tại mãi mãi. Không có phương pháp thu thập dữ liệu nào sẽ không bao giờ được thay thế. Tất cả điều này có thể và sẽ xảy ra, và các doanh nghiệp cần thận trọng đo lường, đánh giá và đánh giá lại cách thức của họ hệ thống hoạt động. "

4. Sử dụng bộ công cụ đa dạng

Có hàng tá công cụ ML có sẵn, nhiều trong số đó bạn có thể sử dụng miễn phí. Bạn đã có các thư viện khung mã nguồn mở phổ biến như Caffe, H20, Shogun, TensorFlow và Torch và ML trong một số dự án của Apache Software Foundation (ASF) bao gồm Mahout, Singa và Spark. Sau đó, có các tùy chọn dựa trên đăng ký bao gồm Amazon Machine Learning, BigML và Microsoft Azure Machine Learning Studio. Microsoft cũng có Bộ công cụ nhận thức miễn phí.

Có vô số tài nguyên có sẵn. Dunning đã nói chuyện với nhiều doanh nghiệp, nhà khoa học dữ liệu và các học viên ML và luôn hỏi họ có bao nhiêu khuôn khổ và công cụ khác nhau mà họ sử dụng. Trung bình, Dunning cho biết hầu hết cho biết họ sử dụng tối thiểu 5-7 công cụ và thường là nhiều hơn nữa.

"Bạn không thể dán mắt vào một công cụ. Bạn sẽ phải sử dụng một số công cụ, và như vậy, tốt hơn hết là bạn nên xây dựng hệ thống của mình theo cách không thể tin được", Dunning nói. "Bất cứ ai cố gắng thuyết phục bạn rằng công cụ này là thứ duy nhất bạn cần là bán cho bạn một hóa đơn hàng hóa.

"Một cái gì đó có thể xảy ra vào tuần tới làm đảo lộn giỏ táo và với tốc độ đổi mới mà chúng ta đang thấy, điều đó sẽ tiếp tục xảy ra trong ít nhất 5 đến 10 năm nữa, " Dunning tiếp tục. "Hãy xem một ví dụ học tập rẻ tiền trong đó có thể bạn đang sử dụng lại một trình phân loại hình ảnh hiện có để phân tích hình ảnh trong một danh mục. Đó là học sâu với tầm nhìn máy tính được đưa vào. Nhưng có những công cụ đã đóng gói tất cả. Bạn cần để đo lường, đánh giá và bỏ trống giữa các công cụ khác nhau và cơ sở hạ tầng của bạn cần được chào đón điều đó. "

5. Thử nghiệm với học tập lai

Dunning cho biết bạn cũng có thể kết hợp việc học rẻ và học sâu với nhau thành một thứ gì đó lai. Ví dụ: nếu bạn lấy một mô hình thị giác máy tính hiện có và xây dựng lại một vài lớp trên cùng trong đó đưa ra quyết định, thì bạn có thể đồng chọn một khung hiện có cho trường hợp sử dụng hoàn toàn mới. Dunning chỉ vào một cuộc thi Kaggle trong đó các thí sinh đã làm điều đó; họ lấy một bộ dữ liệu và viết một thuật toán mới lên trên để giúp máy tính phân biệt mèo với chó.

"Phân biệt mèo và chó là một điều rất tinh tế đối với thuật toán ML. Hãy nghĩ về logic: Mèo có đôi tai nhọn nhưng Chó chăn cừu Đức cũng vậy. Chó không có đốm, ngoại trừ Dalmatians, v.v. Điều đó có thể khá khó nhận ra và của chính nó, "Dunning nói. "Người chiến thắng đã phát triển một hệ thống đã làm điều này với độ chính xác 99%. Nhưng tôi ấn tượng hơn với người đứng thứ ba. Thay vì xây dựng từ đầu, anh ta đã lấy một chương trình nhận dạng hình ảnh hiện có từ một nhiệm vụ khác, đã gỡ bỏ Lớp trên cùng, và đặt một bộ phân loại đơn giản vào đó. Ông đã đưa ra một số ví dụ, và ngay sau đó, nó chính xác 98% trong việc phân biệt mèo với chó. Toàn bộ quá trình này đã khiến anh chàng mất ba giờ. "

6. Giá rẻ không có nghĩa là xấu

Mặc dù ý nghĩa công khai, Dunning cho biết học rẻ không có nghĩa là học kém. Lượng thời gian bạn dành cho việc triển khai ML không tương quan trực tiếp đến giá trị kinh doanh của nó. Chất lượng quan trọng hơn, ông nói, là để đảm bảo quá trình được lặp lại và đáng tin cậy. Nếu doanh nghiệp có thể đạt được điều đó mà không cần đầu tư một lượng tài nguyên không đáng có, thì đó là điều tốt hơn.

"Giá rẻ không có nghĩa là xấu. Nếu nó hoạt động, nó hoạt động. Nếu nó rẻ và nó hoạt động, thì thật tuyệt. Nhưng nỗ lực bạn bỏ ra để xây dựng nó không xác định giá trị. Đó là một sai lầm chi phí tổng thể", Dunning nói . "Điều xác định giá trị là cách nó cải thiện công việc kinh doanh. Nếu cải thiện lợi nhuận hoặc giảm chi phí hoặc cải thiện tình hình cạnh tranh của bạn. Đó là hiệu quả, không phải là nỗ lực."

7. Đừng gọi nó là AI

Dunning nhấn mạnh rằng, khi nói về các kỹ thuật này, các doanh nghiệp nên sử dụng thuật ngữ chính xác: ML, thị giác máy tính hoặc học sâu. Tất cả những điều này có xu hướng rơi vào thuật ngữ "trí tuệ nhân tạo", nhưng đối với Dunning, định nghĩa về AI chỉ đơn giản là "những thứ chưa hoạt động."

"Định nghĩa tốt nhất mà tôi từng nghe về AI là đó là những điều chúng ta chưa thể giải thích. Những điều chúng ta chưa tìm ra", Dunning nói. "Mỗi khi chúng tôi làm việc gì đó, mọi người lại nói 'Ồ, đó không phải là AI, nó chỉ là phần mềm. Nó chỉ là một công cụ quy tắc. Nó thực sự chỉ là hồi quy hậu cần.' Trước khi chúng tôi tìm ra thứ gì đó, chúng tôi gọi nó là AI. Sau đó, chúng tôi luôn gọi nó là thứ khác. Theo nhiều cách, AI được sử dụng tốt hơn như một từ cho biên giới tiếp theo, và trong AI, sẽ luôn có một biên giới tiếp theo. chúng ta sẽ đi đâu, không phải nơi chúng ta đã đến. "

7 lời khuyên cho sự thành công của máy học