Những điểm nổi bật chính từ Ultralytics tại CVPR 2025

Abirami Vina

3 phút đọc

Ngày 18 tháng 6 năm 2025

Hãy cùng chúng tôi tóm tắt lại trải nghiệm của Ultralytics tại CVPR 2025, từ những điểm nổi bật của gian hàng đến các trường hợp sử dụng thị giác máy tính thực tế và những khoảnh khắc đáng nhớ tại Nashville.

Tuần trước, từ ngày 11 đến ngày 15 tháng 6, nhóm Ultralytics đã có mặt tại Nashville, Tennessee, để tham dự CVPR 2025 - Hội nghị IEEE/CVF về Thị giác máy tính và Nhận dạng mẫu. Đây là một trong những sự kiện thường niên quan trọng trong lĩnh vực nghiên cứu thị giác máy tính và AI. 

Được tổ chức tại Music City Center, hội nghị năm nay đã quy tụ hơn 12.000 người tham dự từ khắp nơi trên thế giới. Từ các nhà nghiên cứu và kỹ sư học thuật đến các nhà lãnh đạo và nhà phát triển trong ngành, sự kiện này có sự góp mặt của những người thúc đẩy ranh giới của Vision AI. 

Đặc biệt, CVPR 2025 có các cuộc thảo luận và nghiên cứu tiên tiến về mọi thứ, từ học sâu trong thị giác máy tính và học đa phương thức đến các mô hình AI tạo sinh, mô hình nền tảng và các ứng dụng thực tế như lái xe tự động và hiểu cảnh 3D.

Hình 1. CVPR 2025 tại Nashville, Tennessee.

Đối với Ultralytics, tuần lễ tại CVPR 2025 tập trung vào việc kết nối với cộng đồng thị giác máy tính, chia sẻ bản demo và tìm hiểu cách các mô hình YOLO Ultralytics của chúng tôi đang được sử dụng trong nhiều ngành công nghiệp. Tại Gian hàng 1512, chúng tôi đã giới thiệu các giải pháp Vision AI mới nhất của mình, trao đổi với hàng trăm khách tham quan về các trường hợp sử dụng thực tế và tận mắt chứng kiến cách công việc của chúng tôi thúc đẩy các sáng kiến trong nhiều lĩnh vực như robot, bán lẻ, nghiên cứu, v.v. 

Vậy hãy cùng xem lại một số khoảnh khắc đáng nhớ nhất của sự kiện, nêu bật những thông tin quan trọng, cuộc trò chuyện và kết nối cộng đồng. 

Một cái nhìn về CVPR Nashville 2025

CVPR lần đầu tiên được giới thiệu vào năm 1983 và được IEEE chính thức hỗ trợ vào năm 1985. Trong những năm qua, hội nghị đã phát triển thành một trong những hội nghị có ảnh hưởng nhất trong lĩnh vực thị giác máy tính và nhận dạng mẫu, quy tụ các nhà nghiên cứu, kỹ sư và nhà đổi mới trên toàn thế giới. Từ năm 2012, hội nghị được đồng tài trợ bởi Computer Vision Foundation (CVF), một tổ chức phi lợi nhuận hỗ trợ quyền truy cập mở vào nghiên cứu thị giác máy tính và đóng vai trò quan trọng trong việc tổ chức sự kiện. 

Được tổ chức hàng năm, CVPR đã trở nên nổi tiếng vì chiều sâu kỹ thuật và giúp định hình hướng đi của toàn bộ lĩnh vực, từ những đột phá ban đầu trong nhận dạng đối tượng cho đến những tiến bộ ngày nay trong Vision AI và học sâu. Phiên bản năm nay đã chứng kiến hơn 13.000 bài báo được gửi, tăng 13% so với năm ngoái. Với tỷ lệ chấp nhận chỉ 22%, hội nghị tiếp tục truyền thống của mình là làm nổi bật nghiên cứu có tác động cao.

Sau đây là cái nhìn tổng quan về một số chủ đề nghiên cứu chính nổi bật tại CVPR 2025:

  • Hiểu bối cảnh 3D và kết xuất thần kinh: Các nhà nghiên cứu đang khám phá cách tái tạo và thể hiện thế giới trong ba chiều bằng cách sử dụng nhiều góc nhìn hoặc đầu vào cảm biến để phát triển các ứng dụng trong robot, thực tế tăng cường và mô phỏng.
  • Tổng hợp hình ảnh và video bằng AI tạo hình : Lĩnh vực này tập trung vào việc tạo ra hình ảnh chất lượng cao từ dữ liệu đầu vào tối thiểu, như lời nhắc văn bản hoặc bản phác thảo, để cung cấp năng lượng cho các công cụ thế hệ tiếp theo cho phương tiện truyền thông sáng tạo và hệ thống tương tác.
  • Mô hình học tập đa phương thức và mô hình ngôn ngữ thị giác: Các mô hình này kết hợp dữ liệu thị giác và ngôn ngữ để cải thiện khả năng hiểu biết, lý luận và giao tiếp, mở đường cho các hệ thống AI tổng quát và thích ứng hơn.

Chuẩn bị tại Trung tâm Âm nhạc Thành phố cho CVPR

Trước khi hội nghị chính thức bắt đầu, nhóm của chúng tôi đã đến Nashville để chuẩn bị mọi thứ cho CVPR 2025. 

Chúng tôi dành cả ngày để thiết lập tại Music City Center, nơi Gian hàng 1512 trở thành căn cứ của chúng tôi trong ba ngày đầy đủ các buổi demo, trò chuyện và xây dựng cộng đồng . Với thiết bị mang theo, chúng tôi đã mở hộp phần cứng, cấu hình các bản demo YOLO trực tiếp và sắp xếp cẩn thận thiết lập của mình để đảm bảo mọi thứ diễn ra suôn sẻ trong môi trường triển lãm có nhịp độ nhanh. 

Không gian dần dần tràn ngập những người đang dỡ hàng, thử nghiệm bản demo và lắp ráp gian hàng của họ. Việc chứng kiến tất cả mọi thứ kết hợp lại với nhau đã nhắc nhở chúng tôi rằng CVPR thực sự mang tính toàn cầu và hợp tác như thế nào.

Sau một buổi chiều hiệu quả, nhóm chuyển hướng và đi khám phá trung tâm thành phố Nashville. Tất nhiên, họ dừng lại ở Broadway, nơi nhạc đồng quê sống động tràn ra từ mọi quán bar và nhà hàng. 

Một số thành viên trong nhóm đã chọn giày cao bồi (lần đầu tiên đối với một số người trong chúng tôi), và họ kết thúc buổi tối bằng một món ăn địa phương cổ điển được yêu thích: gà cay từ Hattie B's. Đó là sự kết hợp hoàn hảo giữa công việc và niềm vui. Gian hàng đã sẵn sàng và nhóm đã được nạp lại năng lượng để xem CVPR 2025 có gì.

Các cuộc trò chuyện về thị giác máy tính và nghiên cứu AI

Ngày đầu tiên của triển lãm bắt đầu với nhóm Ultralytics có mặt tại chỗ và sẵn sàng lên đường. Nuvola Ladi , Trưởng phòng Nội dung Kỹ thuật số, Zinnia Pourdad , Trưởng phòng Sự kiện và Francesco Mattioli , Kỹ sư Học máy của chúng tôi, đã đến Trung tâm Âm nhạc City lúc 9 giờ sáng. Sau khi hoàn tất các bước kiểm tra thiết lập cuối cùng và chuẩn bị bản demo, chúng tôi đã sẵn sàng chào đón những người tham dự ngay khi cánh cửa mở.

Đến 10 giờ sáng, đám đông bắt đầu đổ về, và năng lượng trên sàn triển lãm tăng lên ngay lập tức. Gian hàng của chúng tôi nhanh chóng chật kín khách tham quan, và hàng hóa Ultralytics của chúng tôi, đặc biệt là túi tote và nhãn dán, đã hết trong vòng vài phút. Đó là một trò chơi phá băng thú vị giúp bắt đầu các cuộc trò chuyện và thu hút mọi người.

Hình 2. Nuvola Ladi , Zinnia PourdadFrancesco Mattioli tại Booth 1512.

Trong suốt cả ngày, chúng tôi đã có cơ hội trò chuyện với các nhà nghiên cứu, kỹ sư và nhà phát triển đang làm việc trên nhiều dự án khác nhau. Có rất nhiều sự quan tâm đến các bản demo YOLO trực tiếp của chúng tôi và chúng tôi đã nghe về các trường hợp sử dụng trong lĩnh vực robot, chăm sóc sức khỏe , sản xuất, bán lẻ và hơn thế nữa. Thật truyền cảm hứng khi thấy các mô hình của chúng tôi được sử dụng rộng rãi như thế nào, từ nghiên cứu học thuật ban đầu đến các hệ thống doanh nghiệp đã triển khai.

Chúng tôi cũng được kết nối lại với những người cộng tác trong lĩnh vực AI, bao gồm các nhóm từ Intel OpenVINO và Sony Semiconductor Solutions. Việc chia sẻ sàn diễn với những người đổi mới khác đã giúp củng cố thêm sự hợp tác và phát triển nhanh chóng của lĩnh vực Vision AI.

Vào cuối ngày, nhóm đã đến Printers Alley để thưởng thức một số bản nhạc đồng quê sống động và thư giãn. Sau một ngày trò chuyện bận rộn và năng lượng đáng kinh ngạc trên sàn diễn, đó là cách hoàn hảo để kết thúc ngày đầu tiên của chúng tôi tại CVPR 2025.

Hình 3. Nhóm đã có cơ hội khám phá Printers Alley.

Ngày thứ 2 tại hội nghị về thị giác máy tính ở Nashville

Ngày thứ hai của CVPR 2025 tiếp tục diễn ra đúng như ngày đầu tiên. Gian hàng 1512 vẫn đông đúc trong suốt cả ngày, với những du khách quay lại và những người tham dự mới ghé thăm để tìm hiểu thêm về các mô hình YOLO Ultralytics của chúng tôi và chia sẻ công việc của họ.

Ví dụ, một trong những khoảnh khắc đáng nhớ nhất trong ngày là khi Intel Robodog ghé thăm. Việc chứng kiến phần cứng tiên tiến kết hợp với các mô hình thị giác thực tế đang hoạt động thực sự đã nắm bắt được tinh thần của sự kiện.

Hình 4. Intel Robodog đã đến thăm nhóm tại gian hàng 1512.

Vào buổi tối muộn, nhóm của chúng tôi đã tham dự After.CVPR() Developer Meetup do Intel tổ chức. Đây là một không gian thoải mái và hợp tác với các kỹ sư, nhà nghiên cứu và nhà phát triển từ khắp hệ sinh thái AI. 

Buổi gặp mặt có các bản demo trực tiếp và các cuộc trò chuyện có ý nghĩa kéo dài đến tận đêm. Trong sự kiện, Francesco Mattioli đã trình bày bản demo chung có sự góp mặt của Ultralytics và OpenVINO, giới thiệu cách các mô hình của chúng tôi có thể được tích hợp vào các đường ống suy luận hiệu quả. 

Ông đã trình bày cách các mô hình như Ultralytics YOLO11 có thể được xuất sang định dạng OpenVINO để đạt được suy luận nhanh hơn, tối ưu hơn trên phần cứng Intel. Bản demo nêu bật sự hỗ trợ cho các đơn vị xử lý trung tâm (CPU), đơn vị xử lý đồ họa (GPU) và đơn vị xử lý thần kinh (NPU). Nó đã thu hút sự quan tâm đáng kể từ các nhóm làm việc trên AI biên và các ứng dụng thời gian thực.

Hình 5. Một cái nhìn thoáng qua về buổi gặp gỡ các nhà phát triển After.CVPR().

Học sâu trong các ứng dụng thị giác máy tính tại CVPR

Ngay cả vào ngày cuối cùng của CVPR 2025, Trung tâm Âm nhạc Thành phố vẫn nhộn nhịp với các hoạt động. Những người tham dự vẫn đang khám phá các gian hàng, trò chuyện sâu sắc và tận dụng tối đa thời gian của họ tại hội nghị.

Một trong những điểm nhấn của ngày là xem các phiên họp áp phích - một phần cốt lõi trong cách chia sẻ nghiên cứu tại CVPR. Không giống như các bài thuyết trình trên sân khấu truyền thống, các phiên họp áp phích mang tính tương tác và không chính thức hơn. 

Mỗi nhà nghiên cứu dựng một tấm áp phích in lớn tóm tắt công trình của họ và đứng gần đó để giải thích, trả lời câu hỏi và thảo luận về những phát hiện của họ với bất kỳ ai ghé qua. Đây là một cách tuyệt vời để tìm hiểu về nhiều chủ đề trong thời gian ngắn và tạo không gian cho các cuộc trò chuyện thực sự giữa người tham dự và người thuyết trình.

Chúng tôi đã thấy nhiều loại áp phích bao gồm mọi thứ từ mô hình ngôn ngữ thị giác và hiểu biết về bối cảnh 3D đến các ứng dụng AI trong thế giới thực trong robot và chăm sóc sức khỏe. Các phiên họp đã cho chúng tôi cái nhìn sâu sắc hơn về những ý tưởng mới nhất đang được khám phá trong lĩnh vực này và cơ hội kết nối trực tiếp với những người đứng sau chúng.

Khi sự kiện kết thúc, chúng tôi cảm thấy có động lực hơn bao giờ hết. Tuần này tràn ngập học tập, hợp tác và động lực thực sự trong Vision AI, và chúng tôi rất vui mừng khi đưa những hiểu biết đó vào những việc tiếp theo.

Những điểm chính

CVPR 2025 là một tuần tuyệt vời để học hỏi, chia sẻ và kết nối. Từ nghiên cứu tiên tiến đến các bản demo thực hành và các cuộc trò chuyện tuyệt vời, hội nghị đã cho thấy Vision AI đang phát triển nhanh như thế nào và cộng đồng đằng sau nó thực sự có tác động và hỗ trợ như thế nào.

Thật truyền cảm hứng khi thấy các mô hình YOLO của Ultralytics hoạt động trong rất nhiều ứng dụng thực tế và nghiên cứu. Hơn hết, CVPR 2025 đã chứng minh rõ ràng rằng thị giác máy tính là trọng tâm của đổi mới AI, với rất nhiều điều hơn nữa sẽ đến.

Tham gia cộng đồng của chúng tôi và khám phá Vision AI trên kho lưu trữ GitHub của chúng tôi. Tìm hiểu về những đổi mới như AI trong bán lẻthị giác máy tính trong sản xuất trên các trang giải pháp của chúng tôi. Kiểm tra các gói cấp phép của chúng tôi và bắt đầu hành trình AI của bạn ngay hôm nay!

Hãy cùng xây dựng tương lai
của AI cùng nhau!

Bắt đầu hành trình của bạn với tương lai của máy học

Bắt đầu miễn phí
Liên kết đã được sao chép vào clipboard
OSZAR »