Thuật ngữ

Nửa chính xác

Khám phá cách độ chính xác một nửa (FP16) tăng tốc AI với tốc độ tính toán nhanh hơn, giảm mức sử dụng bộ nhớ và triển khai mô hình hiệu quả.

Half-precision, về mặt kỹ thuật được gọi là FP16 (Floating-Point 16-bit), là một định dạng số sử dụng 16 bit để biểu diễn một số, trái ngược với các định dạng 32-bit single-precision (FP32) hoặc 64-bit double-precision (FP64) phổ biến hơn. Trong lĩnh vực trí tuệ nhân tạo (AI) và đặc biệt là học sâu (DL) , việc tận dụng half-precision đã trở thành một kỹ thuật quan trọng để tối ưu hóa quá trình đào tạo và suy luận mô hình, cân bằng hiệu quả tính toán với độ chính xác số. Nó cho phép các mô hình chạy nhanh hơn và tiêu thụ ít bộ nhớ hơn, giúp AI phức tạp khả thi trên nhiều loại phần cứng hơn.

Half-Precision là gì?

Số dấu phẩy động được sử dụng để biểu diễn số thực trong máy tính, xấp xỉ chúng trong một số bit cố định. Tiêu chuẩn IEEE 754 định nghĩa các định dạng phổ biến, bao gồm FP16 và FP32. Số FP16 sử dụng 1 bit cho dấu, 5 bit cho số mũ (xác định phạm vi) và 10 bit cho phần có nghĩa hoặc phần thập phân (xác định độ chính xác). Để so sánh, FP32 sử dụng 1 bit dấu, 8 bit số mũ và 23 bit có nghĩa. Việc giảm bit này có nghĩa là FP16 có phạm vi số nhỏ hơn đáng kể và độ chính xác thấp hơn FP32. Để biết tổng quan cơ bản về cách các định dạng này hoạt động, hãy xem phần cơ bản về số học dấu phẩy động .

Lợi ích của độ chính xác một nửa

Việc sử dụng FP16 mang lại một số lợi thế trong quy trình học sâu:

Giảm sử dụng bộ nhớ: Trọng số mô hình , kích hoạt và gradient được lưu trữ trong FP16 chỉ cần một nửa bộ nhớ so với FP32. Điều này cho phép sử dụng các mô hình lớn hơn, kích thước lô lớn hơn hoặc triển khai trên các thiết bị có bộ nhớ hạn chế.
Tính toán nhanh hơn: Phần cứng hiện đại, chẳng hạn như GPU NVIDIA với Tensor Core và bộ xử lý chuyên dụng như Google TPU , có thể thực hiện các hoạt động FP16 nhanh hơn nhiều so với các hoạt động FP32.
Thông lượng được cải thiện và độ trễ thấp hơn: Sự kết hợp giữa yêu cầu băng thông bộ nhớ giảm và tính toán nhanh hơn dẫn đến thông lượng cao hơn trong quá trình đào tạo và độ trễ suy luận thấp hơn, cho phép suy luận theo thời gian thực cho các ứng dụng đòi hỏi khắt khe.

Nhược điểm tiềm ẩn

Mặc dù có lợi, nhưng việc chỉ sử dụng FP16 đôi khi có thể dẫn đến các vấn đề:

Phạm vi số giảm: Phạm vi số mũ nhỏ hơn khiến số FP16 dễ bị tràn số (trở nên quá lớn) hoặc tràn số (trở nên quá nhỏ, thường là bằng 0).
Độ chính xác thấp hơn: Số lượng bit quan trọng giảm có nghĩa là độ chính xác thấp hơn, đôi khi có thể ảnh hưởng đến độ chính xác cuối cùng của các mô hình nhạy cảm nếu không được quản lý cẩn thận.
Các vấn đề về gradient: Trong quá trình đào tạo, các giá trị gradient nhỏ có thể tràn xuống 0 trong FP16, cản trở việc học. Điều này có thể làm trầm trọng thêm các vấn đề như gradient biến mất .