Bóc tách hóa đơn GTGT là gì?
Bóc tách hóa đơn GTGT là quá trình trích xuất thông tin từ hóa đơn giá trị gia tăng
bao gồm: mã số thuế, tên công ty bán/mua, tiền hàng, thuế GTGT, tổng thanh toán.
Công cụ này sử dụng OCR (Optical Character Recognition) để tự động nhận diện text
từ ảnh/PDF.
Dữ liệu có được upload lên server không?
Không. Tất cả được xử lý ngay trên trình duyệt của
bạn bằng Tesseract.js. File hóa đơn không rời khỏi máy tính, đảm bảo bảo mật tuyệt đối cho dữ liệu
kế toán.
Công cụ này hỗ trợ những loại file nào?
Hỗ trợ: PDF, PNG, JPG, JPEG, WEBP, BMP, TIFF. Với file PDF, công cụ
sử dụng PDF.js để render thành ảnh trước khi OCR. Chất lượng ảnh càng cao → kết quả OCR càng chính
xác.
Xuất dữ liệu ra định dạng nào?
Hỗ trợ xuất: Excel (.xlsx) với đầy đủ các cột theo chuẩn kế toán, và
MISA format tương thích với phần mềm MISA SME.NET để nhập liệu hàng loạt.
Làm sao để OCR chính xác hơn?
Để đạt độ chính xác cao: (1) Sử dụng hóa đơn điện tử PDF gốc thay vì
ảnh chụp; (2) Nếu chụp ảnh, đảm bảo đủ sáng, không bị mờ, góc thẳng;
(3) Độ phân giải tối thiểu 300 DPI; (4) Luôn kiểm tra và chỉnh sửa
kết quả OCR trước khi xuất.