Kiểm tra màu xanh lá cây
Liên kết được sao chép vào khay nhớ tạm

Xuất khẩu Ultralytics YOLO11 sử dụng PaddlePaddle tích hợp

Tìm hiểu cách xuất khẩu Ultralytics YOLO các mô hình như Ultralytics YOLO11 với PaddlePaddle để triển khai hiệu quả trên các nền tảng biên, di động và đám mây.

Khi trí tuệ nhân tạo (AI) phát triển, máy móc ngày càng hiểu rõ hơn về thế giới xung quanh. Một lĩnh vực chính thúc đẩy sự tiến bộ này là thị giác máy tính , một nhánh của AI cho phép máy móc diễn giải và đưa ra quyết định dựa trên dữ liệu trực quan.

Từ việc giúp xe ô tô nhận dạng biển báo giao thông đến kiểm tra kệ hàng trong các cửa hàng bán lẻ, thị giác máy tính hiện là một phần của nhiều công cụ hàng ngày. Các tác vụ này dựa trên các mô hình Vision AI có thể quét nhanh ảnh hoặc video và xác định những gì quan trọng.

Theo thời gian, các mô hình này đã trở nên nhanh hơn và chính xác hơn, khiến chúng hữu ích trong các lĩnh vực như nông nghiệp, chăm sóc sức khỏe, an ninh và bán lẻ. Ví dụ, Ultralytics YOLO11 là một mô hình được xây dựng để xử lý một loạt các tác vụ thị giác máy tính với tốc độ và độ chính xác. Nó có thể phát hiện và phân loại các đối tượng, theo dõi chuyển động và ước tính tư thế cơ thể.

Một phần quan trọng trong việc chuyển tầm nhìn máy tính từ nghiên cứu sang ứng dụng thực tế là triển khai. Sau khi mô hình đã được đào tạo, bước tiếp theo là chạy nó trên các thiết bị như điện thoại, phần cứng biên hoặc máy chủ đám mây. 

Hình 1. Triển khai mô hình là một phần quan trọng của bất kỳ dự án thị giác máy tính nào.

Để hỗ trợ điều này, các mô hình YOLO Ultralytics như YOLO11 có thể được xuất sang nhiều định dạng khác nhau tùy thuộc vào nền tảng mục tiêu. Một trong những định dạng này là PaddlePaddle , một khuôn khổ AI nguồn mở cho phép triển khai mô hình và suy luận hiệu quả trên nhiều loại thiết bị và hệ thống.

Trong bài viết này, chúng ta sẽ khám phá cách Ultralytics YOLO11 có thể được xuất thông qua tích hợp PaddlePaddle được hỗ trợ bởi Ultralytics để cho phép triển khai hiệu quả trên nhiều nền tảng khác nhau.

Là gì PaddlePaddle ? 

Việc triển khai các mô hình AI bên ngoài phạm vi nghiên cứu, như trên thiết bị di động hoặc phần cứng biên, đôi khi có thể khó khăn, đặc biệt là khi bạn cần chúng chạy hiệu quả và sử dụng ít tài nguyên nhất. PaddlePaddle là một khuôn khổ học sâu được thiết kế để hỗ trợ chính xác cho mục đích đó.

Đây là một nền tảng mã nguồn mở của Trung Quốc, với tên viết tắt của Parallel Distributed Deep Learning. Được phát triển bởi Baidu, một công ty nổi tiếng với công việc trong lĩnh vực AI và cơ sở hạ tầng phần mềm, PaddlePaddle được tạo ra đặc biệt cho các ứng dụng thực tế, không chỉ dành cho nghiên cứu.

Các nhà phát triển có thể chạy các mô hình trong PaddlePaddle định dạng trên máy chủ, thiết bị biên và thậm chí cả phần cứng di động. Nó cũng hỗ trợ các công cụ đơn giản hóa quá trình phát triển AI, bao gồm các tùy chọn mã thấp và không mã. Nền tảng này có cộng đồng nhà phát triển mạnh mẽ với hơn 4,7 triệu người dùng và được sử dụng trong nhiều ngành công nghiệp khác nhau, bao gồm chăm sóc sức khỏe, nông nghiệp, sản xuất và tài chính.

Các tính năng chính của PaddlePaddle

Sau đây là một số tính năng chính giúp ích PaddlePaddle chạy mô hình hiệu quả hơn trên các thiết bị thực tế:

  • Chuyển đổi đồ thị động sang tĩnh: Tính năng này biến mô hình linh hoạt thành phiên bản cố định chạy mượt mà và dễ dự đoán hơn. Mô hình cố định dễ tối ưu hóa hơn và nhanh hơn khi đưa ra dự đoán.
  • Hợp nhất toán tử: PaddlePaddle có thể kết hợp nhiều bước trong mô hình thành một. Điều này làm giảm lượng bộ nhớ mà mô hình sử dụng và giúp mô hình chạy nhanh hơn. Hãy nghĩ về việc kết hợp nhiều tác vụ thành một hành động duy nhất để tiết kiệm thời gian.
  • Lượng tử hóa : Điều này làm cho mô hình nhỏ hơn bằng cách sử dụng các số đơn giản hơn (như làm tròn đến ít chữ số thập phân hơn). Nó giúp mô hình chạy trên các thiết bị có công suất hạn chế, như điện thoại hoặc máy ảnh thông minh, mà không làm mất nhiều độ chính xác.
Hình 2. Ưu điểm của việc sử dụng PaddlePaddle . Hình ảnh của tác giả.

Tổng quan về YOLO11 triển khai với PaddlePaddle

Các PaddlePaddle tích hợp được hỗ trợ bởi Ultralytics giúp việc chuyển từ đào tạo sang triển khai dễ dàng hơn. Các nhà phát triển đã sử dụng PaddlePaddle công cụ có thể mang lại YOLO11 vào quy trình làm việc của họ dễ dàng hơn.

Các Ultralytics Python gói hỗ trợ xuất khẩu trực tiếp YOLO11 các mô hình cho PaddlePaddle định dạng, cho phép các nhà phát triển triển khai các mô hình đã được đào tạo mà không cần các công cụ bổ sung hoặc các bước chuyển đổi thủ công. 

Quá trình xuất có thể được thực hiện bằng cách sử dụng dòng lệnh hoặc Python code, do đó các nhà phát triển có thể chọn bất kỳ phương pháp nào phù hợp nhất với quy trình làm việc của họ. Điều này giúp mọi thứ đơn giản và giảm khả năng xảy ra sự cố thiết lập. Sau khi xuất, mô hình có thể được sử dụng cho các tác vụ thị giác máy tính như phát hiện đối tượng, phân loại hình ảnh, ước tính tư thế và phân đoạn thể hiện.

Đây là lựa chọn tuyệt vời cho các tình huống triển khai khi thiết bị có bộ nhớ hạn chế hoặc yêu cầu xử lý nhanh. Các mô hình đã xuất được tối ưu hóa để chạy hiệu quả, ngay cả trên các hệ thống có tài nguyên hạn chế. 

Làm thế nào để xuất khẩu YOLO11 mô hình để PaddlePaddle định dạng

Chỉ cần vài bước để xuất YOLO11 ĐẾN PaddlePaddle định dạng mô hình.

Bước đầu tiên là cài đặt gói Ultralytics Python bằng trình quản lý gói như 'pip'. Điều này có thể được thực hiện bằng cách chạy lệnh "pip install ultralytics ” trong dấu nhắc lệnh hoặc thiết bị đầu cuối để bắt đầu.

Các Ultralytics gói cung cấp các công cụ để đào tạo, đánh giá, tinh chỉnh, xuất và triển khai các mô hình cho nhiều tác vụ thị giác máy tính. Nếu bạn gặp bất kỳ sự cố nào trong quá trình cài đặt, hãy kiểm tra hướng dẫn Sự cố thường gặp để biết mẹo khắc phục sự cố.

Sau khi môi trường của bạn được thiết lập, bạn có thể tải và xuất một môi trường được đào tạo trước YOLO11 mô hình như “yolo11n.pt” như hiển thị bên dưới. Bạn cũng có thể xuất mô hình được đào tạo tùy chỉnh của riêng bạn YOLO11 người mẫu.

from ultralytics import YOLO

model = YOLO("yolo11n.pt")

model.export(format="paddle")

Sau khi mô hình của bạn đã được chuyển đổi thành PaddlePaddle định dạng này có thể được triển khai trong nhiều tình huống khác nhau trên nhiều loại phần cứng khác nhau.

Ví dụ, trong ví dụ dưới đây, chúng ta đang tải một YOLO11 mô hình đã được xuất khẩu sang PaddlePaddle định dạng và sử dụng nó để đưa ra dự đoán. Quá trình này, được gọi là chạy suy luận, chỉ đơn giản là sử dụng mô hình để phân tích dữ liệu mới. Ở đây, chúng tôi đang thử nghiệm nó với hình ảnh của hai chú chó.

paddle_model = YOLO("./yolo11n_paddle_model")

results = paddle_model("https://www.pexels.com/photo/2-vizsla-dogs-standing-on-brown-wood-plank-33287/")

Sau khi chạy mã, hình ảnh đầu ra có dự đoán của mô hình sẽ được tự động lưu trong thư mục “runs/detect/predict”.

Hình 3. Sử dụng xuất khẩu YOLO11 mô hình để phát hiện các đối tượng trong hình ảnh. Hình ảnh của Tác giả.

Triển khai YOLO11 sử dụng PaddlePaddle khung

PaddlePaddle cung cấp một số công cụ triển khai, mỗi công cụ phù hợp với các thiết bị và trường hợp sử dụng khác nhau như môi trường đám mây, hệ thống nhúng và ứng dụng web. Sau đây là một số tùy chọn triển khai chính:

  • Paddle Serving: Giúp triển khai các mô hình dưới dạng REST API, là lựa chọn tốt cho môi trường đám mây hoặc máy chủ cần các tính năng như kiểm soát phiên bản và thử nghiệm trực tuyến.
  • Paddle Inference API: Cung cấp cho bạn nhiều quyền kiểm soát hơn đối với cách chạy mô hình, điều này rất hữu ích khi bạn cần tinh chỉnh hiệu suất hoặc xây dựng logic ứng dụng tùy chỉnh.
  • Paddle Lite: Được thiết kế để triển khai nhẹ trên các thiết bị di động, máy tính bảng và hệ thống nhúng. Được tối ưu hóa cho các mô hình nhỏ hơn và suy luận nhanh hơn trên phần cứng có tài nguyên hạn chế.
  • Paddle.js: Công cụ này cho phép bạn chạy các mô hình AI trên trình duyệt web bằng các công nghệ như WebGL và WebAssembly, rất hữu ích cho các bản demo tương tác và các công cụ dựa trên trình duyệt.
Hình 4. Các tùy chọn triển khai được kích hoạt bởi PaddlePaddle . Hình ảnh của tác giả.

Sau khi bạn chọn đúng công cụ cho thiết lập của mình, bạn có thể tải mô hình đã xuất. PaddlePaddle engine sẽ thực hiện các bước tiếp theo. Nó tải mô hình, xử lý hình ảnh đầu vào và trả về kết quả.

Khi nào bạn nên chọn PaddlePaddle tích hợp?

Các Ultralytics Python gói cũng hỗ trợ nhiều định dạng xuất khác nhau, vì vậy bạn có thể tự hỏi: Khi nào thì PaddlePaddle sự lựa chọn đúng đắn?

PaddlePaddle là một lựa chọn đáng tin cậy khi bạn muốn triển khai các mô hình trên các thiết bị có tài nguyên hạn chế, chẳng hạn như điện thoại thông minh, hệ thống nhúng hoặc phần cứng biên. Nó cũng tuyệt vời cho các ứng dụng thời gian thực cần hiệu suất nhanh, hiệu quả, như phát hiện đối tượng trong ứng dụng di động, giám sát dựa trên tầm nhìn trong camera thông minh hoặc ước tính tư thế chạy trực tiếp trên thiết bị mà không cần hỗ trợ đám mây.

Ngoài ra, nếu dự án cần chạy ngoại tuyến hoặc trong môi trường kết nối thấp, bạn có thể cân nhắc sử dụng PaddlePaddle tích hợp. Các ứng dụng như công cụ kiểm tra trực quan trong sản xuất, thiết bị cầm tay để khảo sát thực địa hoặc máy quét bán lẻ hỗ trợ AI có thể được hưởng lợi từ PaddlePaddle Thời gian chạy nhẹ và các tùy chọn triển khai linh hoạt. 

PaddlePaddle những hạn chế cần xem xét

Trong khi PaddlePaddle cung cấp khả năng triển khai thú vị, sau đây là một số yếu tố hạn chế cần lưu ý:

  • Cộng đồng toàn cầu nhỏ hơn : Bên ngoài Trung Quốc, cơ sở người dùng và cộng tác viên tương đối nhỏ. Điều này có thể khiến việc tìm kiếm hỗ trợ cộng đồng, giải quyết các vấn đề GitHub hoặc câu trả lời Stack Overflow trở nên khó khăn hơn.
  • Đường cong học tập dốc hơn đối với các công cụ không phải của Baidu : PaddlePaddle tích hợp trơn tru với hệ sinh thái của Baidu, nhưng sử dụng bên ngoài bối cảnh đó có thể liên quan đến các bước cấu hình và thiết lập bổ sung.
  • Ít tích hợp hơn với các công cụ ML chính thống : PaddlePaddle có khả năng tương thích hạn chế với các công cụ phổ biến như Hugging Face Transformers, MLflow hoặc Kubernetes - dịch vụ AI gốc.

Những điểm chính

Các PaddlePaddle tích hợp được hỗ trợ bởi Ultralytics giúp dễ dàng xuất và triển khai YOLO11 mô hình trên nhiều thiết bị. Nó đặc biệt hữu ích cho các dự án đòi hỏi hiệu suất hiệu quả trên thiết bị - như ứng dụng di động, camera thông minh hoặc hệ thống nhúng.

Chỉ với một vài bước, bạn có thể đưa các mô hình thị giác mạnh mẽ vào các ứng dụng trong thế giới thực. Khi thị giác máy tính tiếp tục phát triển, các công cụ như YOLO Và PaddlePaddle đang giúp việc xây dựng các hệ thống thông minh, nhanh chóng trên mọi thứ, từ thiết bị tiêu dùng đến công cụ công nghiệp trở nên dễ dàng hơn bao giờ hết.

Tham gia cộng đồng đang phát triển của chúng tôi ngay hôm nay! Khám phá sâu hơn về AI bằng cách khám phá kho lưu trữ GitHub của chúng tôi. Bạn đang muốn xây dựng các dự án thị giác máy tính của riêng mình? Khám phá các tùy chọn cấp phép của chúng tôi. Tìm hiểu cách thị giác máy tính trong chăm sóc sức khỏe đang cải thiện hiệu quả và khám phá tác động của AI trong bán lẻ bằng cách truy cập các trang giải pháp của chúng tôi!

Biểu tượng LinkedInBiểu trưng TwitterLogo FacebookBiểu tượng sao chép liên kết

Đọc thêm trong danh mục này

Hãy xây dựng tương lai
của AI cùng nhau!

Bắt đầu hành trình của bạn với tương lai của machine learning

OSZAR »