Hãy cùng chúng tôi tóm tắt lại trải nghiệm của Ultralytics tại CVPR 2025, từ những điểm nổi bật của gian hàng đến các trường hợp sử dụng thị giác máy tính thực tế và những khoảnh khắc đáng nhớ tại Nashville.

Hãy cùng chúng tôi tóm tắt lại trải nghiệm của Ultralytics tại CVPR 2025, từ những điểm nổi bật của gian hàng đến các trường hợp sử dụng thị giác máy tính thực tế và những khoảnh khắc đáng nhớ tại Nashville.
Tuần trước, từ ngày 11 đến ngày 15 tháng 6, nhóm Ultralytics đã có mặt tại Nashville, Tennessee, để tham dự CVPR 2025 - Hội nghị IEEE/CVF về Thị giác máy tính và Nhận dạng mẫu. Đây là một trong những sự kiện thường niên quan trọng trong lĩnh vực nghiên cứu thị giác máy tính và AI.
Được tổ chức tại Music City Center, hội nghị năm nay đã quy tụ hơn 12.000 người tham dự từ khắp nơi trên thế giới. Từ các nhà nghiên cứu và kỹ sư học thuật đến các nhà lãnh đạo và nhà phát triển trong ngành, sự kiện này có sự góp mặt của những người thúc đẩy ranh giới của Vision AI.
Đặc biệt, CVPR 2025 có các cuộc thảo luận và nghiên cứu tiên tiến về mọi thứ, từ học sâu trong thị giác máy tính và học đa phương thức đến các mô hình AI tạo sinh, mô hình nền tảng và các ứng dụng thực tế như lái xe tự động và hiểu cảnh 3D.
Đối với Ultralytics, tuần lễ tại CVPR 2025 tập trung vào việc kết nối với cộng đồng thị giác máy tính, chia sẻ bản demo và tìm hiểu cách các mô hình YOLO Ultralytics của chúng tôi đang được sử dụng trong nhiều ngành công nghiệp. Tại Gian hàng 1512, chúng tôi đã giới thiệu các giải pháp Vision AI mới nhất của mình, trao đổi với hàng trăm khách tham quan về các trường hợp sử dụng thực tế và tận mắt chứng kiến cách công việc của chúng tôi thúc đẩy các sáng kiến trong nhiều lĩnh vực như robot, bán lẻ, nghiên cứu, v.v.
Vậy hãy cùng xem lại một số khoảnh khắc đáng nhớ nhất của sự kiện, nêu bật những thông tin quan trọng, cuộc trò chuyện và kết nối cộng đồng.
CVPR lần đầu tiên được giới thiệu vào năm 1983 và được IEEE chính thức hỗ trợ vào năm 1985. Trong những năm qua, hội nghị đã phát triển thành một trong những hội nghị có ảnh hưởng nhất trong lĩnh vực thị giác máy tính và nhận dạng mẫu, quy tụ các nhà nghiên cứu, kỹ sư và nhà đổi mới trên toàn thế giới. Từ năm 2012, hội nghị được đồng tài trợ bởi Computer Vision Foundation (CVF), một tổ chức phi lợi nhuận hỗ trợ quyền truy cập mở vào nghiên cứu thị giác máy tính và đóng vai trò quan trọng trong việc tổ chức sự kiện.
Được tổ chức hàng năm, CVPR đã trở nên nổi tiếng vì chiều sâu kỹ thuật và giúp định hình hướng đi của toàn bộ lĩnh vực, từ những đột phá ban đầu trong nhận dạng đối tượng cho đến những tiến bộ ngày nay trong Vision AI và học sâu. Phiên bản năm nay đã chứng kiến hơn 13.000 bài báo được gửi, tăng 13% so với năm ngoái. Với tỷ lệ chấp nhận chỉ 22%, hội nghị tiếp tục truyền thống của mình là làm nổi bật nghiên cứu có tác động cao.
Sau đây là cái nhìn tổng quan về một số chủ đề nghiên cứu chính nổi bật tại CVPR 2025:
Trước khi hội nghị chính thức bắt đầu, nhóm của chúng tôi đã đến Nashville để chuẩn bị mọi thứ cho CVPR 2025.
Chúng tôi dành cả ngày để thiết lập tại Music City Center, nơi Gian hàng 1512 trở thành căn cứ của chúng tôi trong ba ngày đầy đủ các buổi demo, trò chuyện và xây dựng cộng đồng . Với thiết bị mang theo, chúng tôi đã mở hộp phần cứng, cấu hình các bản demo YOLO trực tiếp và sắp xếp cẩn thận thiết lập của mình để đảm bảo mọi thứ diễn ra suôn sẻ trong môi trường triển lãm có nhịp độ nhanh.
Không gian dần dần tràn ngập những người đang dỡ hàng, thử nghiệm bản demo và lắp ráp gian hàng của họ. Việc chứng kiến tất cả mọi thứ kết hợp lại với nhau đã nhắc nhở chúng tôi rằng CVPR thực sự mang tính toàn cầu và hợp tác như thế nào.
Sau một buổi chiều hiệu quả, nhóm chuyển hướng và đi khám phá trung tâm thành phố Nashville. Tất nhiên, họ dừng lại ở Broadway, nơi nhạc đồng quê sống động tràn ra từ mọi quán bar và nhà hàng.
Một số thành viên trong nhóm đã chọn giày cao bồi (lần đầu tiên đối với một số người trong chúng tôi), và họ kết thúc buổi tối bằng một món ăn địa phương cổ điển được yêu thích: gà cay từ Hattie B's. Đó là sự kết hợp hoàn hảo giữa công việc và niềm vui. Gian hàng đã sẵn sàng và nhóm đã được nạp lại năng lượng để xem CVPR 2025 có gì.
Ngày đầu tiên của triển lãm bắt đầu với nhóm Ultralytics có mặt tại chỗ và sẵn sàng lên đường. Nuvola Ladi , Trưởng phòng Nội dung Kỹ thuật số, Zinnia Pourdad , Trưởng phòng Sự kiện và Francesco Mattioli , Kỹ sư Học máy của chúng tôi, đã đến Trung tâm Âm nhạc City lúc 9 giờ sáng. Sau khi hoàn tất các bước kiểm tra thiết lập cuối cùng và chuẩn bị bản demo, chúng tôi đã sẵn sàng chào đón những người tham dự ngay khi cánh cửa mở.
Đến 10 giờ sáng, đám đông bắt đầu đổ về, và năng lượng trên sàn triển lãm tăng lên ngay lập tức. Gian hàng của chúng tôi nhanh chóng chật kín khách tham quan, và hàng hóa Ultralytics của chúng tôi, đặc biệt là túi tote và nhãn dán, đã hết trong vòng vài phút. Đó là một trò chơi phá băng thú vị giúp bắt đầu các cuộc trò chuyện và thu hút mọi người.
Trong suốt cả ngày, chúng tôi đã có cơ hội trò chuyện với các nhà nghiên cứu, kỹ sư và nhà phát triển đang làm việc trên nhiều dự án khác nhau. Có rất nhiều sự quan tâm đến các bản demo YOLO trực tiếp của chúng tôi và chúng tôi đã nghe về các trường hợp sử dụng trong lĩnh vực robot, chăm sóc sức khỏe , sản xuất, bán lẻ và hơn thế nữa. Thật truyền cảm hứng khi thấy các mô hình của chúng tôi được sử dụng rộng rãi như thế nào, từ nghiên cứu học thuật ban đầu đến các hệ thống doanh nghiệp đã triển khai.
Chúng tôi cũng được kết nối lại với những người cộng tác trong lĩnh vực AI, bao gồm các nhóm từ Intel OpenVINO và Sony Semiconductor Solutions. Việc chia sẻ sàn diễn với những người đổi mới khác đã giúp củng cố thêm sự hợp tác và phát triển nhanh chóng của lĩnh vực Vision AI.
Vào cuối ngày, nhóm đã đến Printers Alley để thưởng thức một số bản nhạc đồng quê sống động và thư giãn. Sau một ngày trò chuyện bận rộn và năng lượng đáng kinh ngạc trên sàn diễn, đó là cách hoàn hảo để kết thúc ngày đầu tiên của chúng tôi tại CVPR 2025.
Ngày thứ hai của CVPR 2025 tiếp tục diễn ra đúng như ngày đầu tiên. Gian hàng 1512 vẫn đông đúc trong suốt cả ngày, với những du khách quay lại và những người tham dự mới ghé thăm để tìm hiểu thêm về các mô hình YOLO Ultralytics của chúng tôi và chia sẻ công việc của họ.
Ví dụ, một trong những khoảnh khắc đáng nhớ nhất trong ngày là khi Intel Robodog ghé thăm. Việc chứng kiến phần cứng tiên tiến kết hợp với các mô hình thị giác thực tế đang hoạt động thực sự đã nắm bắt được tinh thần của sự kiện.
Vào buổi tối muộn, nhóm của chúng tôi đã tham dự After.CVPR() Developer Meetup do Intel tổ chức. Đây là một không gian thoải mái và hợp tác với các kỹ sư, nhà nghiên cứu và nhà phát triển từ khắp hệ sinh thái AI.
Buổi gặp mặt có các bản demo trực tiếp và các cuộc trò chuyện có ý nghĩa kéo dài đến tận đêm. Trong sự kiện, Francesco Mattioli đã trình bày bản demo chung có sự góp mặt của Ultralytics và OpenVINO, giới thiệu cách các mô hình của chúng tôi có thể được tích hợp vào các đường ống suy luận hiệu quả.
Ông đã trình bày cách các mô hình như Ultralytics YOLO11 có thể được xuất sang định dạng OpenVINO để đạt được suy luận nhanh hơn, tối ưu hơn trên phần cứng Intel. Bản demo nêu bật sự hỗ trợ cho các đơn vị xử lý trung tâm (CPU), đơn vị xử lý đồ họa (GPU) và đơn vị xử lý thần kinh (NPU). Nó đã thu hút sự quan tâm đáng kể từ các nhóm làm việc trên AI biên và các ứng dụng thời gian thực.
Ngay cả vào ngày cuối cùng của CVPR 2025, Trung tâm Âm nhạc Thành phố vẫn nhộn nhịp với các hoạt động. Những người tham dự vẫn đang khám phá các gian hàng, trò chuyện sâu sắc và tận dụng tối đa thời gian của họ tại hội nghị.
Một trong những điểm nhấn của ngày là xem các phiên họp áp phích - một phần cốt lõi trong cách chia sẻ nghiên cứu tại CVPR. Không giống như các bài thuyết trình trên sân khấu truyền thống, các phiên họp áp phích mang tính tương tác và không chính thức hơn.
Mỗi nhà nghiên cứu dựng một tấm áp phích in lớn tóm tắt công trình của họ và đứng gần đó để giải thích, trả lời câu hỏi và thảo luận về những phát hiện của họ với bất kỳ ai ghé qua. Đây là một cách tuyệt vời để tìm hiểu về nhiều chủ đề trong thời gian ngắn và tạo không gian cho các cuộc trò chuyện thực sự giữa người tham dự và người thuyết trình.
Chúng tôi đã thấy nhiều loại áp phích bao gồm mọi thứ từ mô hình ngôn ngữ thị giác và hiểu biết về bối cảnh 3D đến các ứng dụng AI trong thế giới thực trong robot và chăm sóc sức khỏe. Các phiên họp đã cho chúng tôi cái nhìn sâu sắc hơn về những ý tưởng mới nhất đang được khám phá trong lĩnh vực này và cơ hội kết nối trực tiếp với những người đứng sau chúng.
Khi sự kiện kết thúc, chúng tôi cảm thấy có động lực hơn bao giờ hết. Tuần này tràn ngập học tập, hợp tác và động lực thực sự trong Vision AI, và chúng tôi rất vui mừng khi đưa những hiểu biết đó vào những việc tiếp theo.
CVPR 2025 là một tuần tuyệt vời để học hỏi, chia sẻ và kết nối. Từ nghiên cứu tiên tiến đến các bản demo thực hành và các cuộc trò chuyện tuyệt vời, hội nghị đã cho thấy Vision AI đang phát triển nhanh như thế nào và cộng đồng đằng sau nó thực sự có tác động và hỗ trợ như thế nào.
Thật truyền cảm hứng khi thấy các mô hình YOLO của Ultralytics hoạt động trong rất nhiều ứng dụng thực tế và nghiên cứu. Hơn hết, CVPR 2025 đã chứng minh rõ ràng rằng thị giác máy tính là trọng tâm của đổi mới AI, với rất nhiều điều hơn nữa sẽ đến.
Tham gia cộng đồng của chúng tôi và khám phá Vision AI trên kho lưu trữ GitHub của chúng tôi. Tìm hiểu về những đổi mới như AI trong bán lẻ và thị giác máy tính trong sản xuất trên các trang giải pháp của chúng tôi. Kiểm tra các gói cấp phép của chúng tôi và bắt đầu hành trình AI của bạn ngay hôm nay!