Hôm nay tôi có trò chuyện với người mẹ yêu quý của mình, năm nay 78 tuổi, và bà kể rằng Microsoft vừa mua lại một công ty Trí tuệ Nhân tạo (AI). Dĩ nhiên, tôi sẽ không bao giờ cho rằng những người ngoài bảy mươi là lạc hậu hay không theo kịp công nghệ hiện đại, nhưng việc bà nhắc đến điều này vẫn khiến tôi khá bất ngờ.

Điều thú vị là đây chính là điểm kết nối giữa một người 78 tuổi và AI – công ty mà Microsoft mua lại (tên là Nuance) chuyên phát triển phần mềm AI trong lĩnh vực ghi chép, nhập liệu y khoa. Mẹ tôi từng làm công việc ghi chép y khoa khi bà mới chuyển đến Canada lúc 19 tuổi.

Tham khảo khóa học:

AI-900 Azure AI Fundamentals Exam Prep In One Day

Học những kiến thức cơ bản về các dịch vụ Azure AI và Machine Learning (ML) và đạt chứng chỉ với khóa học AI-900 đầy đủ này! | Giảng dạy bởi Scott Duffy

  • Hơn 1.000.000+ học viên, lĩnh vực Phần mềm

Vì vậy, sau khi mẹ tôi nói rằng Microsoft đã mua lại công ty này, tôi phải giải thích cho bà rằng công ty đó tạo ra những máy tính thông minh có thể làm chính công việc mà bà từng làm trước đây. Ngày nay, số lượng người làm nghề ghi chép y khoa ít hơn rất nhiều so với những năm 1960.

Dưới đây là biểu đồ Google Trends cho từ khóa “medical transcriptionist” (nhân viên ghi chép y khoa) theo thời gian:

Biểu đồ trên phản ánh một loại công việc đã phần lớn bị AI thay thế.

AI hiện diện ở khắp nơi trong cuộc sống hằng ngày của chúng ta — ở những nơi ta có thể nhìn thấy, và cả những nơi ta không hề nhận ra. Khi chúng ta nói chuyện với điện thoại hay loa thông minh và yêu cầu chúng thực hiện một tác vụ nào đó, một máy tính ở trung tâm dữ liệu xa xôi sẽ phân tích âm thanh và xác định ý định của chúng ta. Máy tính đó có thể hiểu lời nói và cả những ý định tinh tế mà không cần ai phải lập trình trước từng từ cụ thể để mang một ý nghĩa nhất định.

“Alexa, sẽ thật tuyệt vời không thể tin được nếu bây giờ bạn có thể giảm bớt ánh đèn. Cảm ơn nhé, cưng!”

Gần như cùng lúc đó, trong một hệ thống máy tính khác, một thuật toán AI đã quyết định rằng mức độ tín nhiệm tài chính của chúng ta đã được cải thiện và đang chuẩn bị gửi cho chúng ta một lá thư đề nghị tăng hạn mức tín dụng. Đây là machine learning (ML) tự động, không có bất kỳ quyết định hay sự can thiệp nào của con người.

Một số người có thể nói rằng AI và ML là tương lai của chúng ta, nhưng tôi cho rằng đó chính là hiện tại. AI và ML có mặt ở khắp nơi — trong xe hơi, đèn giao thông, ngôi nhà của chúng ta, trong túi áo, và tại nơi làm việc.

Nếu một máy tính đã viết bài blog này, có lẽ bạn cũng không hề nhận ra. Có một chương trình ML rất thú vị tên là GPT-3, có thể viết bài theo cách rất giống với cách con người viết.

Nếu bạn có chút hứng thú với AI, dù có nền tảng kỹ thuật hay không, có lẽ bạn nên tham gia một khóa học và tìm hiểu những kiến thức cơ bản. Một cách để làm điều đó là tham gia một kỳ thi chứng chỉ AI cơ bản, chẳng hạn như kỳ thi do Microsoft cung cấp.

Kỳ thi AI-900 của Microsoft kiểm tra một loạt kiến thức nền tảng cơ bản liên quan đến các nguyên lý chung của AI và ML. Đồng thời, kỳ thi cũng đảm bảo rằng thí sinh có kiến thức cơ bản về các dịch vụ AI trên nền tảng Microsoft Azure.

  • Chi phí: 99 USD
  • Số câu hỏi: 40–60
  • Thời gian làm bài: 60 phút (90 phút nếu tính cả khảo sát trước và sau kỳ thi)
  • Dạng câu hỏi: Trắc nghiệm
  • Trình độ: Người mới bắt đầu
  • Thời hạn chứng chỉ: Không hết hạn, có giá trị trọn đời

Có thể bạn đã từng nghe đến AI, nhưng thực chất nó là gì? Chúng ta có đang nói đến một cỗ máy tương lai có thể quay ngược thời gian để truy tìm John Connor không? Không, không phải loại AI đó. Đó được gọi là AI tổng quát (Generalized AI) và theo hiểu biết hiện tại, nó vẫn chưa được phát minh.

Khi chúng ta nói đến “AI”, chúng ta đang nói về một loại AI rất chuyên biệt. AI chuyên biệt này có khả năng và phạm vi đào tạo rất hạn chế, cụ thể. Các nhà khoa học dữ liệu huấn luyện AI chuyên biệt thông qua một kỹ thuật gọi là machine learning (ML).

Nói một cách đơn giản, bạn có thể định nghĩa AI là bất kỳ công nghệ nào nhằm mô phỏng bộ não con người. Bộ não con người tiếp nhận dữ liệu đầu vào từ năm giác quan:

  • Thị giác qua mắt
  • Thính giác qua tai
  • Khứu giác qua mũi
  • Xúc giác qua cảm giác chạm
  • Vị giác qua vị giác

Bộ não con người sử dụng các đầu vào này để đưa ra quyết định và hành động. Nó có thể hiểu các cuộc trò chuyện xung quanh, phản hồi lại những cuộc trò chuyện đó, dự đoán điều sắp xảy ra dựa trên những gì nó nhìn thấy, hoặc đơn giản là nhận diện một số đối tượng nhất định.

Tất nhiên, không phổ biến việc một máy tính đám mây có mũi, cảm giác chạm hay vị giác, nhưng AI vẫn tiếp nhận dữ liệu đầu vào thông qua các “giác quan” của nó:

  • Dữ liệu hình ảnh (video)
  • Dữ liệu âm thanh
  • Dữ liệu văn bản

Dựa trên các đầu vào này, “bộ não” AI cũng đưa ra quyết định và có thể được lập trình để thực hiện hành động.

Các khối lượng công việc AI phổ biến và những lưu ý quan trọng

Đối với kỳ thi AI-900 Azure AI Fundamentals, điều quan trọng là phải hiểu các khối lượng công việc AI phổ biến. Dựa trên những đầu vào này, một thuật toán ML có thể:

  • Dự báo hoặc dự đoán (ví dụ: dự báo thời tiết)
  • Phân loại đối tượng (đây là chim cánh cụt hay mèo?)
  • Sắp xếp dữ liệu thành các cụm (những mục này có liên quan với nhau)
  • Phát hiện bất thường trong luồng dữ liệu máy tính
  • Dịch văn bản giữa các ngôn ngữ
  • Tổng hợp giọng nói
  • Trò chuyện với con người

Việc để một máy tính đưa ra các quyết định quan trọng mà không có sự can thiệp hay kiểm soát của con người là một khái niệm nguy hiểm. Nhiều bộ phim đã được làm về hậu quả của điều đó (“I’ll be back!”). Vì vậy, Microsoft đã xây dựng các nguyên tắc về AI có trách nhiệm, và nội dung này cũng được kiểm tra trong kỳ thi.

Khi con người huấn luyện một mô hình AI để thực hiện một nhiệm vụ, họ thường làm điều đó với ý định tốt. Nhiều bộ phận nhân sự trên khắp thế giới muốn có một hệ thống máy tính để lọc hàng loạt hồ sơ ứng viên cho mỗi vị trí và tự động loại bỏ những ứng viên không đáp ứng các tiêu chí thành công.

Với các giải pháp AI, bạn không lập trình chính xác từng tiêu chí. Thay vào đó, bạn yêu cầu máy tính phân tích các ứng viên đã thành công (và không thành công) trong quá khứ, rồi tự tìm ra điểm chung của họ. Từ đó, hệ thống có thể dự đoán ứng viên nào có khả năng được tuyển dụng và ứng viên nào không.

Tuy nhiên, điều gì sẽ xảy ra nếu chương trình lọc hồ sơ nhân sự đó kết luận rằng chỉ có nam giới mới có khả năng được tuyển dụng? Khi đó, nó sẽ bắt đầu loại bỏ các hồ sơ có tên nghe không giống tên nam trước khi gửi cho bộ phận nhân sự. Bạn vừa tự động hóa một sự thiên vị chống lại phụ nữ.

Điều này không hề viển vông. Nó thực sự đã xảy ra.

Đó là lý do vì sao các nguyên tắc công bằng của Microsoft nhấn mạnh tầm quan trọng của tính công bằng, độ tin cậy, an toàn, quyền riêng tư, bảo mật, tính bao trùm, tính minh bạch và trách nhiệm giải trình.

Kỳ thi AI-900 cũng có câu hỏi liên quan đến những chủ đề này.

Nguyên lý machine learning trên Azure

AI-900 là một kỳ thi ở mức độ nền tảng. Bạn không bắt buộc phải thiết kế hay triển khai các giải pháp bằng Azure ML và các dịch vụ AI của Azure.

Tuy nhiên, điều quan trọng là bạn cần nắm vững các lựa chọn mà Azure cung cấp. Bạn nên hiểu rõ các thuật ngữ cũng như cách machine learning (ML) hoạt động. Bạn cũng cần có khả năng giải thích cho người khác biết liệu một mô hình ML có tốt hay không.

Ví dụ, dưới đây là những loại thuật toán ML phổ biến nhất:

  • Thuật toán hồi quy (Regression algorithms): dùng để dự đoán
  • Thuật toán phân loại (Classification algorithms): dùng để nhận diện hoặc xác định một đối tượng
  • Thuật toán phân cụm (Clustering algorithms): dùng để nhóm các đối tượng có liên quan với nhau
  • Deep learning: sử dụng các mạng nơ-ron nhân tạo

Một mô hình ML thành công luôn bắt đầu từ dữ liệu tốt và số lượng lớn. Tập dữ liệu bạn cung cấp cho máy phải phản ánh một cách công bằng những gì thuật toán sẽ gặp trong thế giới thực. Không nhóm nào nên bị đại diện quá ít hoặc quá nhiều. Bạn có thể nghĩ rằng 10.000 dòng dữ liệu là nhiều, nhưng 100.000 dòng sẽ tốt hơn, và một triệu dòng còn tốt hơn nữa.

Giai đoạn đầu tiên trong quá trình phát triển một mô hình ML là thu thập và chuẩn bị dữ liệu. Bạn cần đưa dữ liệu từ nơi nó đang tồn tại vào Azure. Dữ liệu đó có thể chưa được định dạng tốt, và có thể chứa “dữ liệu xấu”. Bạn cần làm sạch dữ liệu này.

Giai đoạn thứ hai là xây dựng đặc trưng (feature engineering) và lựa chọn đặc trưng (feature selection). Bạn có thể có 200 cột dữ liệu cho mỗi dòng, nhưng rất có thể bạn không cần dùng đến tất cả. Có lẽ chỉ một số ít cột thực sự liên quan đến quyết định mà bạn đang dạy cho máy tính đưa ra. Nếu bạn đang cố dự đoán doanh số bán hàng trong tương lai, vị trí của khách hàng có thể là yếu tố liên quan, nhưng chắc chắn tên của khách hàng thì không.

“Dữ liệu cho thấy 12% doanh số của chúng ta đến từ những người tên John, vì vậy chúng ta bắt đầu chiến dịch quảng cáo Facebook chỉ nhắm đến những người tên John.”

Giai đoạn thứ ba trong quá trình phát triển mô hình là huấn luyện và đánh giá mô hình. Bạn cho mô hình tiếp cận dữ liệu, sử dụng thuật toán đã chọn, và để nó xử lý toàn bộ dữ liệu. Điểm then chốt là sau đó phải đánh giá mô hình bằng cách yêu cầu nó dự đoán kết quả của một tập dữ liệu mà nó chưa từng thấy trước đây. Từ đó, bạn có thể đánh giá mức độ chính xác của mô hình khi sử dụng dữ liệu kiểm thử.

Cuối cùng, bước cuối cùng là triển khai mô hình tốt nhất vào môi trường sản xuất và bắt đầu sử dụng nó trong ứng dụng thực tế của bạn.

Các khối lượng công việc Computer Vision trên Azure

Một chủ đề khác trong kỳ thi AI-900Azure Cognitive Services. Cognitive Services là một tập hợp các mô hình ML được xây dựng sẵn, cho phép bạn sử dụng mà không cần tự huấn luyện. Tuy nhiên, trong một số trường hợp, bạn vẫn có thể tùy chỉnh chúng bằng dữ liệu riêng của mình.

Một nhóm dịch vụ trong đó được gọi là Computer Vision. Giao diện lập trình ứng dụng (API) này có thể được sử dụng để phân tích nội dung của video và hình ảnh, đồng thời trích xuất thông tin giá trị từ chúng. Ví dụ, Computer Vision API có thể:

  • Trích xuất văn bản viết tay và văn bản in từ hình ảnh
  • Nhận diện khuôn mặt người nổi tiếng
  • Nhận diện các địa danh nổi tiếng trên thế giới
  • Nhận diện các vật thể phổ biến như xe đạp hoặc điện thoại
  • Xác định vị trí khuôn mặt người trong ảnh
  • Ước tính độ tuổi và giới tính của những người trong ảnh
  • Tìm cùng một người xuất hiện trong nhiều bức ảnh khác nhau
  • Mô tả nội dung của một bức ảnh
  • Trích xuất thẻ (tag) từ ảnh
  • Trích xuất các trường dữ liệu từ biểu mẫu hoặc hóa đơn
  • Và nhiều tác vụ khác nữa

Thực sự rất ấn tượng khi thấy ngày nay máy tính có thể nhận diện nội dung hình ảnh tốt đến mức nào.

Các khối lượng công việc Xử lý Ngôn ngữ Tự nhiên (NLP) trên Azure

Khi một máy tính có thể hiểu được ý nghĩa và mục đích trong ngôn ngữ của con người, điều đó được gọi là xử lý ngôn ngữ tự nhiên (Natural Language Processing – NLP).

Công nghệ này đã giúp việc tìm kiếm trên Internet trở nên dễ dàng hơn rất nhiều. Bạn chỉ cần nhập một vài từ vào công cụ tìm kiếm yêu thích như Google, và hệ thống sẽ đoán được khá chính xác điều bạn đang muốn tìm, thay vì chỉ đơn thuần so khớp từ khóa.

Máy tính cũng đã trở nên giỏi hơn rất nhiều trong việc dịch văn bản giữa các ngôn ngữ. Chỉ khoảng 10 năm trước, việc dịch thuật vẫn mang tính máy móc và sát chữ. Trong những ngày đầu của Internet, người ta thường đùa bằng cách dịch một đoạn văn từ tiếng Anh sang ngôn ngữ khác, rồi dịch ngược lại sang tiếng Anh để cười vì kết quả rất vô lý. Ngày nay, khi làm điều đó, bạn sẽ thấy bản dịch khá chính xác — và nó không còn buồn cười nữa.

Không chỉ dừng lại ở việc hiểu văn bản viết, lời nói hay dịch thuật, máy tính còn ngày càng hiểu ý nghĩa tốt hơn. Hiện nay, máy tính có thể đọc những đoạn văn bản dài (chẳng hạn như bài blog này) và tóm tắt chúng thành vài câu ngắn một cách khá chính xác.