VScan cho Android

VScan

Rastislav Kish

phiên bản 0.2.3

A visual perception layer for the blind

Lượt Tải Về 145
Ads

Đánh Giá Điều Này

Kết quả quét Antivirus & an toàn

Ngày Quét: Oct 27, 2025 Phiên Bản Phần Mềm: 0.2.3
Trạng Thái: ✅ Tin Cậy & An Toàn để cài đặt Ứng dụng này được ký bởi Rastislav Kish với chữ ký số tin cậy và xác thực và nó sẽ cập nhật các cài đặt VScan hiện có Dấu vân tay Chứng chỉ: 81713c3b73ff1c11d2673db51b8c61165e38fc8d Người Phát Hành: C:Unknown, CN:Rastislav Kish, L:Unknown, O:Unknown, ST:Unknown, OU:Unknown Cách chúng tôi xác minh bảo mật của file APK
Antivirus Android Trạng Thái
K7GW Sạch ✅
DrWeb Sạch ✅
VirIT Sạch ✅
ClamAV Sạch ✅
Google Sạch ✅
Ikarus Sạch ✅
Lionic Sạch ✅
Sophos Sạch ✅
Yandex Sạch ✅
Alibaba Sạch ✅
Tencent Sạch ✅
Xcitium Sạch ✅
Fortinet Sạch ✅
Kingsoft Sạch ✅
Symantec Sạch ✅
AhnLab-V3 Sạch ✅
Kaspersky Sạch ✅
Microsoft Sạch ✅
Trustlook Sạch ✅
ESET-NOD32 Sạch ✅
Avast-Mobile Sạch ✅
NANO-Antivirus Sạch ✅
BitDefenderFalx Sạch ✅

VScan Giúp người khuyết tật ứng dụng cho Android mô tả

This is a little project of mine aiming to research how vision LLMs could help out blind people on travel and in their every-day life by substituting eyesight for various visual tasks. VScan turns your smartphone's camera into a device for visual perception. You can define various optical cognitive functions, like looking for objects, signs, evaluating a scene or simply mediating visual impressions. You can afterwards use these functions on the camera view, just like a sighted person would use their eyes to achieve a specific goal in the physical world.

Each cognitive tool consists of two major parts:

  • The camera to be used - front / back, as well as camera parameters - resolution, flashlight etc.
  • The prompts used for LLM processing. LLM is the bridge between raw pixel data and your interpretation of it, and in the user/system prompt, you can specify what exactly are you interested in for the particular function and how should it be communicated, as well as the LLM model that should be used.
Camera input in combination with an LLM processing prompt forms a cognitive function, which can be used to serve various visual tasks.

VScan is open-source software. Visit the project's official repository to learn more about its background, motivation, specific usage examples and setup instructions.

Ads


Thông Số Kỹ Thuật