V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
XR843
V2EX  ›  分享创造

做了一个聚合全球 483 个佛教数字资源的开源平台,支持 AI 问答和知识图谱

  •  
  •   XR843 · 7 天前 · 597 次点击
    大家好,分享一个我做的项目 —— 佛津
    (FoJin),一个全球佛教古籍数字资源聚合平台。

    做这个的原因:
    全球佛学数字资源分散在几百个网站( CBETA 、SuttaCentral 、BDRC 、84000
    等),语言不同、格式不同、接口不同。研究者花在"找经文"上的时间比"读经
    文"还多。我想把它们聚合到一起。

    目前的功能:

    - 聚合 483 个数据源,覆盖 30 个国家/地区、30 个语种
    - 8,949 条经典目录检索 + 4,488 卷全文在线阅读
    - 6 部佛学辞典、237,593 条词条(中/梵/巴利/英)
    - 多语种平行对读(汉/梵/巴利/藏/英等 29 种语言)
    - 知识图谱:9,600+ 实体、3,800+ 关系,力导向图可视化
    - AI 佛学问答:基于 RAG ,覆盖 38 部核心佛经约 1,100
    万字,回答附原文引用
    - 支持 BYOK ( Bring Your Own Key ),用户可配置自己的 API Key

    技术栈:

    - 前端:React 18 + TypeScript + Vite + Ant Design 5
    - 后端:FastAPI + SQLAlchemy (async) + Pydantic v2
    - 数据库:PostgreSQL 15 + pgvector + Elasticsearch 8 (ICU 分词)
    - AI:RAG (向量检索 + 关键词检索),支持通义千问/DeepSeek/OpenAI 等
    - 部署:Docker Compose + Nginx + Cloudflare

    在线体验: https://fojin.app

    GitHub: https://github.com/xr843/fojin

    Apache 2.0 开源,欢迎 Star 、提 Issue 或贡献代码。

    做这个项目的过程中学到了很多(多语种 NLP 、IIIF
    协议、知识图谱构建),也踩了不少坑。如果大家感兴趣,可以交流一下。
    4 条回复    2026-03-16 07:24:34 +08:00
    haloandspike
        1
    haloandspike  
       7 天前
    我最近在做一个类似的项目,也是针对古籍的,想问下楼主用的是什么 OCR 模型哇?
    cyber001
        2
    cyber001  
       5 天前
    感谢楼主分享,我补充一个网站: https://agama.buddhason.org/ 关于原始佛教经典研究、翻译的
    XR843
        3
    XR843  
    OP
       4 天前
    @haloandspike 目前主要是聚合全球的佛教相应的资源 以及知识图谱与 AI 问答功能 后续如果有需要的话可能会迭代 OCR 功能
    XR843
        4
    XR843  
    OP
       3 天前
    @cyber001 已经添加。可查阅: https://fojin.app/sources
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   4657 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 171ms · UTC 09:56 · PVG 17:56 · LAX 02:56 · JFK 05:56
    ♥ Do have faith in what you're doing.