V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
EL743
V2EX  ›  分享创造

[开源求 star] 我做了个 AI 截图工具,支持 OCR、翻译和图像分析与处理

  •  
  •   EL743 · 1 天前 · 467 次点击

    SnapFlow

    仓库地址

    SnapFlow Logo

    SnapFlow 是一个基于 Qt 的 AI 截图工具。
    它不是把截图当作终点,而是把截图变成后续处理的入口:分析、处理、提取、翻译

    大多数截图工具解决的是“把内容截下来”。
    SnapFlow 更关心的是:截下来之后,你还要怎么继续处理它。

    当前项目主要以 macOS 作为开发和验证环境,同时保留了基于 Qt 的跨平台扩展基础。

    为什么是 SnapFlow

    SnapFlow 想做的,不只是一个“更好看的截图工具”,而是一个围绕屏幕内容工作的轻量入口:

    • 看到一块内容,直接截图
    • 围绕这块内容继续理解
    • 再进一步处理、提取和编辑

    一句话概括:

    SnapFlow = Screenshot + Flow + AI

    核心功能

    1. AI 图像分析

    对截图区域直接发起 AI 分析,而不是先上传图片、再手动描述上下文。
    无论是数据面板、图表、后台 dashboard ,还是复杂界面区域,SnapFlow 都希望让 AI 直接围绕你看到的内容继续工作。

    AI 图像分析

    2. AI 图像处理

    SnapFlow 不只停留在“看懂图片”,还希望进一步支持围绕选区做图像处理。
    你可以把它理解为:截图之后,不只是解释这块区域,还可以继续对它做操作。

    AI 图像处理

    3. OCR + 翻译

    看到一段外语内容,不应该还要再复制、粘贴、切去翻译工具。
    SnapFlow 希望把“截图 -> 识别 -> 翻译”压缩成一条更短的路径。

    OCR 翻译

    适合什么场景

    • 截图一块 dashboard ,让 AI 帮你读懂数据
    • 截图某个界面区域,让 AI 帮你分析当前内容
    • 截图后快速去掉某个元素,或对隐私信息打码
    • 截图一段英文报错或设置说明,直接翻译成中文
    • 在截图、理解、处理之间减少来回切换

    当前进展

    • 已完成:区域截图、基础标注编辑、OCR 文字识别、文本翻译覆盖、AI 问答与图像分析
    • 已打通:托盘入口、快捷键唤起、macOS 构建与打包流程
    • 持续打磨中:交互细节、稳定性、分发体验,以及围绕选区继续处理内容的能力

    快速开始

    1. 准备依赖

    当前示例以 macOS 为准,你需要:

    • Qt 6
    • CMake 3.16+
    • Homebrew 安装的 tesseractleptonicapkg-config
    brew install tesseract leptonica pkg-config
    

    2. 配置环境变量

    参考 .env.example 创建一个 .env 文件,至少填入你自己的 QWEN_API_KEY

    cp .env.example .env
    

    3. 构建项目

    cmake -S . -B build-mac-release -DCMAKE_BUILD_TYPE=Release -DCMAKE_PREFIX_PATH="$HOME/Qt/6.10.2/macos"
    cmake --build build-mac-release -j2
    

    4. 运行应用

    open build-mac-release/snapflow.app
    

    如果你想直接在终端里看日志,也可以运行:

    ./build-mac-release/snapflow.app/Contents/MacOS/snapflow
    

    首次使用截图功能时,macOS 可能会要求你授予“屏幕录制”权限。

    打包(可选)

    如果你只是本地验证,建议先用 ad-hoc 签名打包:

    CODESIGN_IDENTITY="-" ./scripts/package-macos.sh
    

    如果你的 Qt 不在默认路径,可以显式指定:

    CODESIGN_IDENTITY="-" QT_PREFIX_PATH="$HOME/Qt/6.10.2/macos" ./scripts/package-macos.sh
    

    如果你已经在钥匙串里配置好了本地签名证书,也可以直接运行默认脚本:

    ./scripts/package-macos.sh
    

    License

    本项目基于 MIT License 开源。

    仓库地址

    4 条回复    2026-03-21 09:34:02 +08:00
    crstudio
        1
    crstudio  
       1 天前
    我也想做,集看图,截图,改图一体。你做好了,我就不做了。
    EL743
        2
    EL743  
    OP
       1 天前
    @crstudio 这类工具大家的理解和取舍都不一样,说不定你做出来会比我这个更顺手。
    lemos1235
        3
    lemos1235  
       21 小时 37 分钟前
    tesseract ocr 的识别能力怕是有点低哦
    EL743
        4
    EL743  
    OP
       11 小时 41 分钟前 via iPhone
    @lemos1235 有其他方案推荐吗
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2901 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 20ms · UTC 13:15 · PVG 21:15 · LAX 06:15 · JFK 09:15
    ♥ Do have faith in what you're doing.