目录

Github Daily Trending

发布于

本期内容涵盖TapXWorld / ChinaTextbook开源电子教材,xming521 / WeClone个人数字分身克隆工具,mem0ai / mem0 AI记忆层,neondatabase / neon无服务器Postgres,happycola233 / tchMaterial-parser智慧教育平台教材下载工具,git-bug / git-bug Git分布式缺陷管理,microsoft / PowerToys微软效率工具集,n8n-io / n8n工作流自动化平台,trycua / cua AI高性能虚拟环境,punkpeye / awesome-mcp-servers MCP服务器列表,以及alibaba / spring-ai-alibaba Spring AI Agent框架和virattt / ai-hedge-fund AI对冲基金模拟项目。

TapXWorld / ChinaTextbook

这是一个名为 ChinaTextbook 的 GitHub 项目,提供中国中小学及大学部分基础课程的开源电子教材 PDF,并针对文件过大提供了合并工具,旨在促进教育资源共享和教育公平。

项目介绍

这个 GitHub 项目名为 "ChinaTextbook",其核心定位是提供中国小初高及大学阶段的 PDF 格式电子教材。项目旨在将原本在官方网站上发布但普通用户获取受限的教育资源进行集中和开源分享,以促进义务教育的普及、消除地区间教育不平等,并为海外华人的子女提供了解国内教育的机会。

项目主要提供了以下功能和内容:

  • 提供完整的中国大陆制式的小学、初中(包括五·四学制)、高中各年级各科目的 PDF 教材文件。
  • 包含高等数学、线性代数、离散数学、概率论等大学基础数学课程的教材。
  • 针对 GitHub 单个文件大小限制(50MB 警告,100MB 拒绝),项目将超过 50MB 的 PDF 文件拆分为多个小于 35MB 的部分。
  • 提供了一个用于合并这些被拆分 PDF 文件的 Windows 可执行程序 mergePDFs.exe。用户只需将该程序与被拆分的 PDF 文件放在同一目录下运行即可自动完成合并。
  • 提供了 mergePDFs.go 文件的源代码,用户可以审计该合并程序的实现。
  • 推荐了另一个开源项目 tchMaterial-parser,作为在中国内地网络环境较好时重新下载教材的备选方案。

从内容结构来看,项目重点在于数学科目的教材,详细列出了小学、初中和高中数学各年级上下册人民教育出版社版本的 PDF 链接。大学数学部分则按课程提供了教材文件。

项目的技术栈相对简单,主要是以文件存储和管理为主。核心是一个用于合并 PDF 文件的 Go 语言编写的 Windows 可执行程序。

目标用户主要包括:

  • 希望免费获取中国大陆义务教育及大学部分基础课程电子教材的学生、家长、教师或其他学习者。
  • 受限于网络或地理位置,难以从官方渠道高效获取资源的群体。
  • 希望子女能够接触和学习中国国内教育内容的海外华人家庭。
  • 希望通过集中开源资源来促进教育公平和资源共享的社区成员。

项目的当前状态显示为积极维护中,并提供了支持项目的方式(支付宝捐赠二维码)。该项目通过开源分享教育资源,对抗资源垄断和商业化,体现了积极的社会价值。

项目统计与信息

  • 作者: TapXWorld
  • 主要语言: Roff
  • Stars: 19767 ⭐
  • Forks: 4044 🍴
  • 本周期新增 Stars: 4813 ⭐

要了解更多关于 TapXWorld / ChinaTextbook 的信息、查看完整的贡献者列表或参与项目,请访问其 GitHub 仓库


xming521 / WeClone

本项目WeClone旨在通过个人聊天记录训练大语言模型,帮助用户快速创建具备自身语言风格的数字分身,并可部署到多种聊天平台。

项目介绍

该项目名为 WeClone,旨在提供一个从聊天记录创建数字分身的一站式解决方案。核心理念是使用个人聊天记录微调大语言模型(LLM),使其具备用户的语言风格和特质,然后将微调后的模型绑定到聊天机器人,从而实现用户的数字分身。该项目涵盖了数字克隆、数字分身和数字永生的相关概念,利用 LLM 和 LoRA 等技术。

核心功能包括:

  • 🌟 涵盖了从聊天数据导出、预处理到模型训练和部署的全链路方案,简化了数字分身的创建流程。
  • 💬 利用微信等平台的聊天记录进行 LLM 微调,使生成内容更具个人特色和“那味儿”。
  • 🔗 支持将数字分身部署到多种主流聊天平台机器人,如微信、QQ、Telegram、企业微信、飞书等。
  • 🛡️ 强调隐私保护,提供隐私信息过滤功能,并支持本地化微调和部署,确保数据安全可控。

项目特性与说明提示:

  • WeClone 处于快速迭代阶段,效果仍在持续优化。
  • 微调效果与模型大小、聊天数据的数量和质量密切相关,通常模型越大、数据越多效果越好。
  • Windows 环境下的兼容性未完全测试,推荐使用 WSL 或类似环境运行。
  • 项目提供了详细的 Windows 部署指南、环境搭建、模型下载和数据准备、预处理步骤。
  • 数据预处理功能包括去除敏感信息(手机号、身份证号、邮箱、网址等),并支持自定义禁用词过滤。数据清洗功能可利用 LLM 对聊天记录进行评分,以便筛选高质量数据进行训练。

技术栈与依赖概述:

  • 项目默认使用 Qwen2.5-7B-Instruct 模型进行微调,推荐使用 LoRA 方法。
  • 需要配备具有 CUDA 12.4 及以上版本的 GPU 环境,根据不同模型大小和微调方法(Full, Freeze/LoRA, QLoRA等),所需的显存容量从 4GB 到上百 GB 不等,默认配置(7B模型,LoRA 16精度)需要约 16GB 显存。
  • 依赖方面,建议使用 uv 进行环境管理和依赖安装,同时也支持手动安装 LLaMA Factory 和 FlashAttention 等依赖以提升性能。
  • 数据提取工具推荐使用 PyWxDump 导出微信聊天记录 CSV 文件。
  • 项目提供了命令行工具 weclone-cli 进行数据集制作、模型训练、web demo 启动和 API 服务启动等操作。
  • 支持单卡和多卡训练,多卡训练可使用 DeepSpeed 加速。
  • 推理方面,提供了基于浏览器的简单 demo 和接口服务。

部署到聊天机器人的说明:

  • 项目提供了与第三方聊天机器人平台集成的示例,包括 AstrBot 和 LangBot。
  • 集成流程通常包括:部署机器人平台 -> 启动 WeClone API 服务 -> 在机器人平台配置 WeClone 的 API 作为模型提供商 -> 根据微调模型特性调整机器人平台的系统提示词和采样参数。

其他信息:

  • 项目路线图包括增强上下文支持、Memory 功能、多模态支持、数据增强以及开发 GUI 界面。
  • 问题解决可参考 LLaMA-Factory 的常见问题或使用 Ask DeepWiki 工具。
  • 项目欢迎代码贡献,提供了开发依赖安装说明和测试、代码检查工具建议。
  • 项目基于 AGPL-3.0 许可证发布。
  • 项目包含重要的免责声明,强调仅用于学习交流,禁止用于非法用途、窃取隐私或非法测试,使用者需自行承担一切后果。

整体而言,WeClone 是一个专注于个人数字分身创建的开源项目,为用户提供了一套从私有数据到个性化 AI 模型的完整流程和工具链,支持多种部署方式,并强调了数据安全和隐私保护。

项目统计与信息

  • 作者: xming521
  • 主要语言: Python
  • Stars: 9618 ⭐
  • Forks: 743 🍴
  • 本周期新增 Stars: 1347 ⭐

要了解更多关于 xming521 / WeClone 的信息、查看完整的贡献者列表或参与项目,请访问其 GitHub 仓库


mem0ai / mem0

mem0是一个为AI助手提供智能记忆层、提升个性化交互的项目,其性能在基准测试中显著优于OpenAI Memory,项目支持多种LLM和多种集成方式,适用于构建更智能、更具上下文感知能力的AI应用。

项目介绍

mem0 (发音为 "mem-zero") 是一个为 AI 助手和代理设计的智能记忆层项目,旨在增强其个性化交互能力。通过记忆用户偏好、适应个人需求并持续学习,该项目特别适用于需要维持上下文一致性和个性化体验的应用,例如客户支持聊天机器人、通用 AI 助手和自主系统。mem0 在 AI 代理记忆领域居于领先地位 (SOTA),并推出了 OpenMemory MCP 组件,用于提供本地且安全的记忆管理方案。

项目核心亮点和研究成果显示,mem0 在 LOCOMO 基准测试中的准确率比 OpenAI Memory 高出 26%,响应速度快 91%(相比全上下文模式),同时能减少 90% 的 Token 使用量,显著降低成本并提高效率。

主要功能和特性包括:

  • 多层记忆管理:能够无缝地保留用户、会话和代理的状态,实现自适应的个性化。
  • 开发者友好:提供直观的 API、跨平台的 SDK(支持 Python 和 Node.js/TypeScript),并可选使用全程托管服务。
  • 支持多种大型语言模型 (LLMs),默认使用 OpenAI 的 gpt-4o-mini,也兼容 Gemini, Azure OpenAI, Ollama, Grok 等多种模型(详细列表见文档)。

适用场景涵盖:

  • 构建能够进行连贯、上下文丰富的对话的 AI 助手。
  • 提升客户支持系统的能力,使其能回顾历史工单和用户记录,提供定制化帮助。
  • 在医疗保健领域跟踪患者偏好和病史,提供个性化护理。
  • 在生产力工具和游戏中,根据用户行为提供自适应的工作流程和环境。

技术栈和依赖主要涉及 Python 和 TypeScript (mem0-ts),同时也依赖于各种 LLM 提供商和可能的向量数据库等后端存储。

安装与配置: 用户可以选择使用 mem0 的托管平台服务,快速通过 SDK 或 API 密钥集成记忆层,享受自动更新、分析和企业级安全。 对于希望自托管的用户,可以通过 pip (Python SDK) 或 npm (Node.js/TypeScript SDK) 安装相应的库。

基本使用方法: mem0 需要一个 LLM 后端才能运行。通过实例化 Memory 类,并结合 LLM 客户端(如 OpenAI 客户端),可以实现检索相关记忆 (memory.search) 和添加新记忆 (memory.add) 的核心功能。项目提供了 Python 的基本使用示例代码,演示了如何集成记忆功能到聊天流程中,实现基于历史记忆和当前查询生成响应,并将对话记录存储为新的记忆。

项目提供了丰富的集成示例和演示:

  • 带有记忆的 ChatGPT 演示。
  • 一个浏览器扩展,用于在不同平台 (ChatGPT, Perplexity, Claude) 上存储和检索记忆。
  • 支持与 Langgraph 和 CrewAI 等 AI 代理框架的集成。

文档和支持资源丰富,用户可以通过官方文档获得详细信息,并通过 Discord 社区、Twitter 和邮件联系项目团队。

项目的代码遵循 Apache 2.0 许可证。

项目统计与信息

  • 作者: mem0ai
  • 主要语言: Python
  • Stars: 30917 ⭐
  • Forks: 2985 🍴
  • 本周期新增 Stars: 598 ⭐

要了解更多关于 mem0ai / mem0 的信息、查看完整的贡献者列表或参与项目,请访问其 GitHub 仓库


neondatabase / neon

Neon是一个开源无服务器Postgres替代方案,通过存储计算分离、自动扩展、代码般分支等特性,革新数据库架构,适合需要弹性、成本效益且工作负载变化大的场景。

项目介绍

Neon是一个开源的无服务器Postgres数据库替代方案,旨在通过分离存储和计算来彻底改变数据库架构。它用一个分布式存储引擎取代了PostgreSQL原生的存储层,从而实现了多项关键特性。

其核心功能包括:

  • 存储与计算分离:这是Neon架构的基础,使得各组件能够独立扩展。
  • 自动扩展:根据负载自动调整计算资源。
  • 代码般的数据库分支:允许用户创建数据库的时间点克隆,便于开发、测试和实验,类似于代码版本控制中的分支操作。
  • 自动缩减至零:在空闲时段,计算资源可以完全缩减,从而降低成本。
  • 弹性存储后端 (Pageserver):负责存储数据,可伸缩。
  • 冗余WAL服务 (Safekeepers):接收并持久化来自计算节点的预写日志 (WAL),确保数据安全,直到 Pageserver 处理并上传至云存储。

该项目的主要技术栈基于 Rust 和 C 语言,其中 Rust 用于构建其核心组件,而 C 语言则与 PostgreSQL 紧密集成。项目还包括 Python 脚本用于测试和开发环境管理,并涉及 Dockerfile 和 Protobuf 等技术。

安装和配置方面,项目提供了在 Linux 和 macOS 系统上的详细依赖安装步骤,包括构建工具、各个发行版所需的软件包(如 build-essential, libtool, zlib, clang, cmake, openssl, python3-poetry 等),以及特定于 macOS 的 XCode 和 Homebrew 依赖。特别强调了需要安装 Rust 和 PostgreSQL 客户端。项目通过 rust-toolchain.toml 文件管理 Rust 版本,并建议使用 rustup 进行管理。构建过程通常涉及克隆仓库、安装依赖并运行 make 命令。

基本使用方法围绕名为 cargo neon 的本地开发控制工具。通过该工具,用户可以初始化仓库、启动页面服务器 (pageserver)、日志守护者 (safekeeper) 和中间代理 (broker) 等核心服务,创建并设置默认租户,创建以及启停数据库计算节点。例如,可以使用 cargo neon init 初始化,cargo neon start 启动服务,cargo neon tenant create --set-default 创建租户,cargo neon endpoint create main 创建计算节点,并通过 cargo neon endpoint start main 启动。一旦计算节点运行,即可使用标准的 PostgreSQL 客户端 (如 psql) 连接并执行 SQL 操作。项目还展示了如何使用 cargo neon timeline branch 创建数据库分支,并在新分支上启动独立的计算节点,以演示其写时复制能力。

该项目主要面向需要弹性、可扩展且注重成本效益的应用场景,特别是那些工作负载变化大、需要频繁进行数据克隆的应用开发和测试场景。其目标用户是开发者、架构师以及需要部署和管理高性能 PostgreSQL 数据库的组织。

项目状态活跃,采用 Apache-2.0 许可证。其独特的优势在于创新的存储计算分离架构,提供了传统 PostgreSQL 难以实现的弹性和分支能力。文档中包含了对架构、源代码结构、贡献指南以及 PostgreSQL 相关术语的详细解释。

项目统计与信息

  • 作者: neondatabase
  • 主要语言: Rust
  • Stars: 17535 ⭐
  • Forks: 600 🍴
  • 本周期新增 Stars: 135 ⭐

要了解更多关于 neondatabase / neon 的信息、查看完整的贡献者列表或参与项目,请访问其 GitHub 仓库


happycola233 / tchMaterial-parser

这是一个Python开发的桌面工具,名为 tchMaterial-parser,旨在从国家中小学智慧教育平台批量下载电子课本PDF,支持Access Token登录、批量下载和跨平台使用。

项目介绍

该项目名为 tchMaterial-parser,是一个用于从国家中小学智慧教育平台下载电子课本的工具。其核心功能是帮助用户获取平台上的电子课本 PDF 文件的下载链接,并进行批量下载,从而方便用户离线阅读和管理课本内容。

项目的主要特点和功能包括:

  • 支持 Access Token 登录:由于自 2025 年 2 月起,国家中小学智慧教育平台访问电子课本需要登录,本工具支持用户手动输入登录后的 Access Token。在 Windows 系统下,Token 可以保存到注册表实现下次自动加载,其他系统目前需临时输入。
  • 支持批量下载:用户可以一次输入多个电子课本的预览页面网址,工具将自动解析并批量下载对应的 PDF 文件。
  • 自动文件命名:下载的 PDF 文件将根据教材名称自动命名,便于用户组织和查找。
  • 高 DPI 适配:用户界面进行了优化,以兼容高分辨率屏幕,提升显示效果。
  • 下载进度可视化:提供实时的下载进度显示,并支持暂停和恢复下载操作。
  • 跨平台支持:本项目支持 Windows、Linux 和 macOS 等主流操作系统,但需要图形界面环境。

该工具主要面向需要从国家中小学智慧教育平台获取并管理电子课本 PDF 文件的教师、学生或家长。

在技术栈方面,本项目主要使用 Python 语言开发,并依赖相关的库来实现网页解析、文件下载和图形界面等功能。

使用过程通常分为三个步骤:输入教材的预览页面网址、设置 Access Token(首次使用或 Token 过期时需要),然后点击下载按钮即可。Access Token 的获取需要用户登录智慧教育平台后,通过浏览器的开发者工具从 localStorage 中查找并复制。

项目的安装方式包括从 GitHub Releases 页面下载编译好的可执行文件(目前主要提供 Windows 和 Linux 的 x64 版本),或对于 Arch Linux 用户,可以通过 AUR(Arch 用户软件仓库)进行安装。

关于 Access Token 的存储,在 Windows 系统中存储于注册表,Linux 系统中存储于配置文件,macOS 等系统目前仅在运行时临时存储于内存。开发者强调,工具不会上传或在云端存储用户的 Token,降低了泄露风险,但也提醒用户不要在公开场合分享自己的 Token。

项目采用 MIT 许可证,允许自由使用和二次开发。

项目统计与信息

  • 作者: happycola233
  • 主要语言: Python
  • Stars: 1438 ⭐
  • Forks: 159 🍴
  • 本周期新增 Stars: 404 ⭐

要了解更多关于 happycola233 / tchMaterial-parser 的信息、查看完整的贡献者列表或参与项目,请访问其 GitHub 仓库


git-bug / git-bug

git-bug是一款分布式、离线优先的缺陷管理工具,它将问题直接存储在Git仓库中,以便与代码同步和离线工作,并提供多种UI和与第三方平台集成的能力。

项目介绍

git-bug 是一个分布式、离线优先的缺陷(issue)管理工具,其独特之处在于将缺陷、评论等信息作为 Git 对象直接嵌入到 Git 仓库中,而非文件形式。这使得缺陷与代码紧密关联,并通过 Git 的推送和拉取机制在多个仓库之间同步。

项目主要功能和特性包括:

  • 原生 Git 存储: 将缺陷、用户和评论直接存储在 Git 仓库内部,与代码一同进行版本控制,实现了数据的一致性和可追溯性。
  • 分布式与版本化: 利用 Git 的分布式架构,用户可以离线工作,并在有网络时无缝同步缺陷信息。
  • 闪电般的速度: 声称能够在毫秒级别列出和搜索缺陷,提供了高效的使用体验。
  • 第三方桥接: 支持通过桥接工具与 GitHub、GitLab 等主流平台同步缺陷,方便与现有工作流集成。
  • 灵活的用户界面: 提供命令行(CLI)、文本用户界面(TUI)和 Web 浏览器等多种交互方式,满足不同用户的使用习惯。
  • 轻松集成: 只需很少的额外设置即可在任何 Git 仓库中启动缺陷管理。

项目旨在提供一个不受中心化服务限制、具备离线工作能力的缺陷跟踪解决方案。它适用于需要分布式协作、版本化跟踪缺陷或在离线环境下工作的开发者和团队。

git-bug 主要使用 Go 语言进行开发,此外也包含少量 TypeScript、Shell、Nix 和 JavaScript 代码。

项目的安装和使用指南详细列于 INSTALLATION.mddoc 目录下的文档中。开发者可以通过提供的文档了解如何安装、配置和使用该工具的各种功能。

该项目遵循 GPLv3 或更高版本的许可证发布。其社区活跃,由贡献者、个人支持者和赞助商共同推动发展。

典型的使用场景包括:

  • 在没有稳定网络连接的环境下进行缺陷管理。
  • 需要将缺陷信息与特定代码版本强关联的项目。
  • 希望拥有完全控制权和数据主权的团队。
  • 对中心化缺陷跟踪系统不满意或有特殊需求的开发者。

项目统计与信息

  • 作者: git-bug
  • 主要语言: Go
  • Stars: 8906 ⭐
  • Forks: 281 🍴
  • 本周期新增 Stars: 182 ⭐

要了解更多关于 git-bug / git-bug 的信息、查看完整的贡献者列表或参与项目,请访问其 GitHub 仓库


microsoft / PowerToys

微软PowerToys是一个面向Windows高级用户的实用工具集,旨在通过提供多种增强功能和自定义选项来显著提升Windows操作效率和用户体验。

项目介绍

微软 PowerToys 是一个专为 Windows 高级用户精心打造的实用工具集,旨在优化和精简 Windows 操作体验,从而大幅提升工作效率。它包含多个独立的实用工具,每个工具专注于解决特定的使用场景问题。

核心功能和特性:

  • 高级粘贴:提供增强的粘贴功能,包括将图片粘贴为文本等(利用 OCR)。
  • 置顶窗口:允许用户将任意窗口始终保持在其他窗口顶部。
  • PowerToys Awake:使计算机保持唤醒状态,防止休眠和屏幕关闭,无需管理电源计划设置。
  • 颜色选择器:一个系统级的颜色选择工具,可以拾取屏幕上任意位置的颜色并显示多种颜色格式。
  • Command Not Found:当在 PowerShell 中输入不存在的命令时,会建议安装相关工具。
  • Command Palette (CmdPal):作为 PowerToys Run 的下一代,是一个高度可扩展的命令启动器,支持搜索应用程序、Shell 命令、文件、Web、Windows 设置、Winget 包等,并提供书签和计算器等功能。它未来计划成为独立的应用程序。
  • Crop And Lock:允许用户裁剪应用窗口的区域,使其保持在前景。
  • 环境变量:提供便捷的方式编辑 Windows 环境变量。
  • FancyZones:窗口管理器,可以轻松创建复杂的窗口布局。
  • 文件资源管理器附加组件:增强文件资源管理器的功能,如预览 SVG、Markdown 等文件。
  • 文件锁匠:检查哪些进程正在使用一个文件,阻止其删除。
  • Hosts 文件编辑器:一个便捷的 hosts 文件图形界面编辑器。
  • 图片尺寸调整器:批量调整图片尺寸的工具,支持多种预设和自定义设置。
  • 键盘管理器:允许用户重新映射键盘按键或快捷键。
  • 鼠标工具:包含查找鼠标位置、鼠标荧光笔等实用工具。
  • 无界鼠标:允许在多台计算机之间共享鼠标和键盘(需在同一网络)。
  • 新建+:增强右键菜单的“新建”功能,支持更多文件类型。
  • 粘贴为纯文本:快速将复制的内容粘贴为纯文本格式。
  • 预览:类似 macOS Spotlight 的文件快速预览工具。
  • PowerRename:批量重命名文件的强大工具,支持搜索替换、正则表达式等。
  • PowerToys Run:一个快速启动器,通过快捷键 (.+Space) 快速搜索和启动应用、文件、计算、执行Shell命令等。
  • 快速重音符号:方便用户输入各种带有重音符号的字符。
  • 注册表预览器:可视化导入 .reg 注册表文件,方便查看将进行的更改。
  • 屏幕标尺:在屏幕上测量像素距离的工具。
  • 快捷键指南:长按 Windows 键显示当前屏幕上可用的通用快捷键。
  • 文本提取器:从屏幕上的任意区域提取文本(OCR 功能)。
  • 工作区:用于组织和快速切换应用窗口集。
  • ZoomIt:来自 Sysinternals 的工具,用于屏幕缩放、标注和演示。

技术栈/依赖:

项目主要使用 C# 和 C++ 开发,利用 .NET 9 等技术。安装程序会安装 Microsoft Edge WebView2 Runtime。CmdPal 模块使用了新的 WinUIEx 库,并计划原生支持 AoT (Ahead-of-Time) 编译。

安装与配置指南概述:

PowerToys 支持多种安装方式,推荐通过 GitHub 发行版下载 EXE 安装程序,或通过 Microsoft Store 或 WinGet 安装。安装过程通常包含了所需的额外组件(如 WebView2)。安装后,用户可以通过 PowerToys Settings UI 对各个工具进行配置。

基本使用方法概述:

每个实用工具都有其特定的激活方式和功能。例如,Command Palette 默认通过 Win + Alt + Space 激活,PowerToys Run 默认通过.+Space 激活,颜色选择器通过 Win + Shift + C 激活。用户可以在 PowerToys 设置中自定义这些快捷键和每个工具的具体行为。

适用场景/目标用户:

PowerToys 主要面向需要对 Windows 系统进行深度定制和优化以提高工作效率的高级用户、开发者、设计师、内容创作者等。它解决的问题包括快速启动应用、高效管理窗口、批量文件操作、快速颜色拾取、屏幕测量等日常高频操作中的痛点。

项目状态与许可证:

项目处于积极开发阶段,不断有新功能加入和现有功能改进。PowerToys 项目遵循 MIT 许可证。

项目统计与信息

  • 作者: microsoft
  • 主要语言: C#
  • Stars: 118649 ⭐
  • Forks: 7002 🍴
  • 本周期新增 Stars: 71 ⭐

要了解更多关于 microsoft / PowerToys 的信息、查看完整的贡献者列表或参与项目,请访问其 GitHub 仓库


n8n-io / n8n

n8n 是一个面向技术团队的代码公平工作流自动化平台,集低/无代码构建与灵活编程(支持 JS/Python)于一体,并原生集成 AI 能力(基于 LangChain),支持私有部署或云服务,提供丰富的集成和模板,满足复杂场景下的自动化需求。

项目介绍

n8n 是一个专为技术团队设计的公平代码工作流自动化平台,集成了原生 AI 能力。它将可视化构建的便捷性与编写自定义代码(支持 JavaScript/Python 并添加 npm 包)的灵活性相结合。用户可以选择自行托管 n8n,或是使用其云服务,以此保持对数据和部署的完全控制。该平台支持 400 多个集成,并提供超过 900 个即用型工作流模板。

核心功能与特性:

  • 需要时可编写代码:提供 JavaScript/Python 代码执行节点,并且支持安装 npm 包,满足复杂逻辑处理需求。
  • 原生 AI 平台:基于 LangChain 构建 AI 代理工作流,支持使用用户自己的数据和 AI 模型提供商(如 Gemini, OpenAI, Azure OpenAI, Ollama, Grok,虽然此处未直接列出具体供应商,但项目描述中AI能力和LangChain框架暗示了对此类模型的支持)。
  • 完全控制权:在公平代码许可证下允许自行托管,同时提供便捷的云服务选项,确保数据主权和部署选择的灵活性。
  • 企业级特性:提供高级权限控制、SSO(单点登录)和离线部署能力,满足企业环境需求。
  • 活跃社区与丰富资源:拥有活跃的社区论坛、详细的文档、大量的集成节点以及丰富的示例工作流模板。

技术栈与依赖:

项目主要使用 TypeScript、Vue 和 SCSS 开发。关键技术点包括:

  • 支持 Node.js 环境。
  • 集成 LangChain 框架用于构建 AI 代理工作流。
  • 提供 Docker 容器镜像用于便捷部署。

安装与配置概述:

可以通过多种方式快速启动 n8n:

  • 使用 npx 命令(需要 Node.js):npx n8n
  • 使用 Docker 部署:创建数据卷后运行 Docker 镜像 docker run -it --rm --name n8n -p 5678:5678 -v n8n_data:/home/node/.n8n docker.n8n.io/n8nio/n8n

基本使用方法概述:

安装并启动后,可以通过浏览器访问 http://localhost:5678 进入可视化编辑器,通过拖拽节点、配置参数或编写少量代码来构建自动化工作流。

适用场景与目标用户:

n8n 主要面向技术团队和开发者,用于连接各种应用和服务,自动化重复性任务、处理数据流、构建集成以及利用 AI 能力创建智能工作流。适用场景广泛,包括但不限于:

  • 数据同步与迁移
  • 自动响应事件
  • 构建自定义 API
  • 低/无代码应用开发
  • 集成 AI 模型到现有业务流程

项目状态与许可证:

项目持续活跃开发中。n8n 采用公平代码(Fair-code)模式,根据 Sustainable Use License 和 n8n Enterprise License 发布。这意味着其源代码公开可见,允许自行托管和扩展。企业用户可以通过购买企业许可证获得额外功能和支持。

许可模式的核心特点包括:源代码可用、可自行托管、可扩展性强。

项目统计与信息

  • 作者: n8n-io
  • 主要语言: TypeScript
  • Stars: 94595 ⭐
  • Forks: 25918 🍴
  • 本周期新增 Stars: 621 ⭐

要了解更多关于 n8n-io / n8n 的信息、查看完整的贡献者列表或参与项目,请访问其 GitHub 仓库


trycua / cua

这是一个专为AI设计的高性能虚拟化Docker项目,能在虚拟容器中让AI控制完整的操作系统,尤其优化了Apple Silicon支持,用于AI执行需要桌面交互的复杂任务。

项目介绍

c/ua (发音为 "koo-ah") 是一个专为计算机使用AI代理设计的Docker容器项目。它旨在提供一个高性能的虚拟化环境,使AI代理能够在接近原生速度的虚拟容器中控制完整的操作系统,尤其优化了对Apple Silicon设备的支持。

该项目的核心目标是赋能AI代理执行复杂、多步骤的任务,这些任务需要与操作系统进行交互,例如操作桌面应用、运行命令行工具、浏览网页等。通过将AI代理的操作封装在高性能的虚拟容器中,c/ua提供了一个稳定、隔离且高效的执行环境。

主要功能和特性:

  • 提供一个基于Docker容器的虚拟化平台,用于运行计算机使用AI代理。
  • 利用Apple的Virtualization.Framework,在Apple Silicon设备上实现接近原生速度的macOS和Linux虚拟机管理。
  • 提供Python SDK,方便开发者通过代码控制虚拟机界面(鼠标、键盘、剪贴板等)和文件系统。
  • 集成多种AI代理循环(Agent Loops),支持不同的AI模型提供商和技术,包括:
    • UITARS-1.5:可在Apple Silicon上使用MLX本地运行,或通过云服务提供商运行。
    • OpenAI Computer-Use:利用OpenAI的计算机使用预览模型。
    • Anthropic CUA:使用Anthropic的计算机使用能力。
    • OmniParser-v2.0:结合Set-of-Marks (SOM) 提示技术,使用任何视觉模型进行UI控制。
  • 提供Lume CLI,用于便捷地安装、管理(列表、拉取镜像、创建、启动、停止、删除)macOS/Linux虚拟机。
  • 提供Lumier,一个类似Docker接口的工具,用于更深度的容器化虚拟机管理。
  • 提供MCP Server模块,方便与其他支持MCP协议的客户端(如Claude Desktop)集成。
  • 包含用于UI自动化辅助的SOM(Set-of-Marks)库。

技术栈/依赖:

  • 主要使用 Python (62.5%) 和 Swift (30.4%) 进行开发。
  • 依赖 Lume CLI 进行虚拟机管理,Lume CLI 利用了 Apple 的 Virtualization.Framework。
  • 支持多种AI模型提供商,包括但不限于 MLX(用于本地运行)、OpenAI、Anthropic、Ollama、OpenRouter (通过OAICOMPAT接口)。
  • 支持 macOS 15 (Sequoia) 及更新版本。
  • 需要配备 Apple Silicon (M1/M2/M3/M4系列) 芯片的 Mac 设备。

安装与配置指南概述:

通常可以通过运行一个快速安装脚本来快速启动一个带UI的计算机使用代理和虚拟机环境。对于开发者而言,需要先安装Lume CLI,然后拉取macOS CUA镜像,最后通过 pip 安装 Python SDK 包 (cua-computercua-agent)。

基本使用方法概述:

通过 Python SDK 可以使用 Computer 类启动一个虚拟机实例,并通过其 interface 对象调用方法执行鼠标点击、键盘输入、截图、文件操作等基础的计算机交互动作。在此基础上,可以结合 ComputerAgent 类和选择合适的 AgentLoop 及 AI 模型,构建和运行能够自主完成任务的AI代理。

适用场景/目标用户:

  • AI研究人员和开发者:需要构建、测试和训练能够与通用操作系统交vwin88互动、执行复杂任务的AI代理。
  • 自动化工程师:希望利用AI能力实现更高级的、需要操作桌面环境的自动化流程。
  • 教育和培训:用于演示和学习AI代理如何理解和控制人机界面。
  • 任何需要AI在虚拟环境中执行桌面级任务的场景。

项目状态与许可证:

项目处于积极开发状态,不断有新的发布。c/ua项目本身采用MIT许可证,而其使用的Microsoft OmniParser部分遵循Creative Commons Attribution 4.0 International License (CC-BY-4.0)。

社区:

项目提供Discord社区支持,供用户讨论、获取帮助和分享成果。

项目统计与信息

  • 作者: trycua
  • 主要语言: Python
  • Stars: 7124 ⭐
  • Forks: 279 🍴
  • 本周期新增 Stars: 441 ⭐

要了解更多关于 trycua / cua 的信息、查看完整的贡献者列表或参与项目,请访问其 GitHub 仓库


punkpeye / awesome-mcp-servers

这个项目是一个精选列表,汇总了支持Model Context Protocol (MCP) 的服务器实现,它们能让AI模型安全地与各种本地及远程资源交互,扩展AI的功能。

项目介绍

这是一个名为 "Awesome MCP Servers" 的 GitHub 项目,旨在 curated(精选)和整理支持 Model Context Protocol (MCP) 的各类服务器实现列表。MCP 是一个开放协议,允许 AI 模型通过标准化的服务器安全地与本地及远程资源进行交互。这个列表重点收集了可用于生产环境或处于实验阶段的 MCP 服务器,它们通过文件访问、数据库连接、API 集成及其他上下文服务来扩展 AI 的能力。

项目主要功能和特性:

  • 全面的服务器列表: 按照不同类型对 MCP 服务器进行了分类,涵盖了多种应用场景。
  • 多种语言和环境支持: 列表中的服务器实现使用了 Python (🐍)、TypeScript/JavaScript (📇)、Go (🏎️)、Rust (🦀)、C# (#️⃣)、Java (☕) 等多种编程语言开发,并支持云服务 (☁️)、本地服务 (🏠) 和嵌入式系统 (📟),以及 macOS (🍎)、Windows (🪟) 和 Linux (🐧) 等操作系统。
  • 广泛的集成: 提供了与各种服务和平台的集成,包括但不限于:
    • 聚合器: 通过单一接口访问多个应用和工具。
    • 艺术与文化: 访问博物馆、艺术收藏等数据库。
    • 浏览器自动化: 搜索、抓取和处理网络内容。
    • 云平台: 管理和交互 AWS, Azure, Cloudflare, Kubernetes 等云服务。
    • 代码执行与编程代理: 在安全环境中执行代码或作为完整的编程助手。
    • 命令行: 运行命令并与 Shell 交互。
    • 通信: 集成 Slack, Telegram, iMessage, Google Calendar 等通信平台。
    • 客户数据平台: 访问和管理客户数据。
    • 数据库: 安全访问 PostgreSQL, MySQL, SQLite, MongoDB, Snowflake, Redis 等多种数据库,具备模式检查和查询能力。
    • 数据平台: 数据集成、转换及管道编排。
    • 开发者工具: 提升开发效率的各类工具和集成,如 Git, GitHub, GitLab, Docker, VS Code 等。
    • 嵌入式系统: 访问嵌入式设备的文档和快捷方式。
    • 文件系统: 直接访问本地或云端(如 Google Drive, IPFS)的文件系统。
    • 金融科技: 访问股票、加密货币等金融市场数据和交易平台。
    • 游戏: 集成Unity, Godot等游戏引擎或访问游戏相关数据。
    • 知识与记忆: 使用知识图谱存储和查询结构化信息,支持 Langfuse, Mem0, Pinecone 等。
    • 位置服务: 提供地理位置、天气、地图等信息。
    • 市场营销: 创建和编辑营销内容,处理网络元数据。
    • 监控: 访问和分析应用监控数据,如 Grafana, Sentry。
    • 多媒体处理: 处理音频和视频内容。
    • 搜索与数据提取: 执行网络搜索,从网页或文档中提取结构化数据,支持 OpenAPI, ArXiv, PubMed, DuckDuckGo, Wolfram Alpha 等。
    • 安全: 提供与安全相关的工具和集成,如 Ghidra, VirusTotal, Shodan。
    • 社交媒体: 集成 Twitter, Facebook, TikTok 等社交媒体平台。
    • 体育: 访问体育赛事数据、结果和统计。
    • 支持与服务管理: 集成 Freshdesk, Jira, Confluence 等支持和项目管理工具。
    • 翻译服务: 提供文本翻译能力。
    • 文本转语音: 提供文本转语音和语音转文本能力。
    • 旅游与交通: 集成 Airbnb, National Park Service, Dutch Railways 等服务。
    • 版本控制: 与 Git, GitHub, GitLab 等版本控制系统交互。
  • 框架与工具: 列出了用于构建 MCP 服务器的框架(如 FastMCP)和其他开发工具。
  • 社区资源: 提供了相关的教程、社区讨论渠道(Reddit, Discord)和在线文档链接。

该项目适用于希望通过 Model Context Protocol (MCP) 为 AI 模型(如 Claude, Cursor)提供更广泛的数据访问和操作能力的开发者、研究人员以及企业。通过利用列表中的 MCP 服务器,用户可以构建功能更强大、能够与真实世界数据和系统交互的 AI 代理和应用。

项目许可证为 MIT。 README 文档提供了多语言版本,包括简体中文。

项目统计与信息

  • 作者: punkpeye
  • 主要语言:
  • Stars: 49445 ⭐
  • Forks: 3680 🍴
  • 本周期新增 Stars: 368 ⭐

要了解更多关于 punkpeye / awesome-mcp-servers 的信息、查看完整的贡献者列表或参与项目,请访问其 GitHub 仓库


alibaba / spring-ai-alibaba

Spring AI Alibaba 项目是为 Java 开发者设计的 AI Agent 框架,基于 Spring AI 并深度集成阿里云通义千问等模型,帮助开发者便捷构建 AI 应用并降低集成复杂性。

项目介绍

以下是“spring-ai-alibaba”项目的中文摘要:

该项目名为 Spring AI Alibaba,是一个为 Java 开发者设计的 Agentic AI 框架。它建立在 Spring AI 之上,旨在帮助 Java 开发者更便捷地构建 AI 原生应用,并提供了与阿里云通义千问(QWen)等大语言模型的深度集成以及云原生基础设施的支持。其核心目标是降低在开发、评估、部署和可观测性等环节中集成 AI 功能的复杂性。

项目的主要功能和特性包括:

  • 支持阿里云通义千问模型及百炼模型服务。
  • 提供高层级的 AI Agent 抽象,即 ChatClient。
  • 支持多种 AI 模型类型,如对话(Chat)、文本到图像(Text to Image)、音频转录(Audio Transcription)和文本到语音(Text to Speech)。
  • 同时支持同步和流式 API 调用。
  • 能够将 AI 模型输出方便地映射到 Java POJO 对象。
  • 提供跨向量数据库供应商的统一可移植 API。
  • 支持函数调用(Function calling)功能。
  • 提供 Spring Boot 自动配置和 Starter 模块,简化集成。
  • 支持检索增强生成(RAG),包括文档读取器(DocumentReader)、分词器(Splitter)、嵌入(Embedding)、向量存储(VectorStore)和检索器(Retriever)。
  • 支持基于 ChatMemory 的对话记忆功能。

要开始使用该项目,开发者需要在 JDK 17 及以上环境的 Spring Boot 3.x 应用中,添加 spring-ai-alibaba-starter 依赖,并注入 ChatClient 对象即可方便地进行 AI 交互。项目中提供了详细的快速开始文档和使用示例。

未来的路线图规划涵盖了更多功能,例如:

  • 提示词模板管理。
  • 事件驱动的 AI 应用开发。
  • 支持更多类型的向量数据库。
  • 函数部署能力。
  • 强大的可观测性支持。
  • AI 代理层支持,用于实现提示词过滤、限流和多模型管理等。
  • 提供更多开发工具。

该项目遵循 Apache-2.0 开源许可证。其设计理念和部分代码参考了 Spring AI、Langgraph 和 Langgraph4J 等优秀开源项目。项目通过钉钉群和微信公众号提供支持和交流渠道。

该项目主要面向希望在 Java 应用中集成大语言模型能力的开发者和技术团队,尤其是在阿里云生态下构建 AI 应用的用户。它旨在提供一个 Spring 风格的、易于使用的框架,帮助开发者快速构建智能化的应用和服务。

项目统计与信息

  • 作者: alibaba
  • 主要语言: Java
  • Stars: 3290 ⭐
  • Forks: 612 🍴
  • 本周期新增 Stars: 120 ⭐

要了解更多关于 alibaba / spring-ai-alibaba 的信息、查看完整的贡献者列表或参与项目,请访问其 GitHub 仓库


xaoyaoo / PyWxDump

PyWxDump是一款获取微信信息、解密数据库、查看和导出聊天记录(支持多种格式和AI应用)的工具,功能强大但仅限学习交流禁止非法使用。

项目介绍

PyWxDump 是一个用于获取微信账户信息、解密微信数据库、查看微信聊天记录并将其导出为多种格式(如 csv, html)的工具。该项目的核心目标是帮助用户管理和利用其本地的微信数据,例如用于人工智能训练或开发自动回复等应用场景。

主要功能和特性包括:

  • 能够获取当前登录微信的用户基础信息,如昵称、账号、手机号、邮箱,以及关键的数据库加密密钥(KEY)。
  • 支持获取 WeChat Original ID (wxid) 和微信文件夹路径,方便定位数据。
  • 基于获取到的 KEY 解密微信数据库,实现对加密数据的访问。
  • 能够整合多种类型的数据库文件,提供统一的数据浏览界面。
  • 提供基于网页的聊天记录查看功能。
  • 支持将聊天记录导出为 html、csv 等格式,方便备份或进一步处理。
  • 支持在局域网内进行远程查看聊天历史。
  • 提供一个仅用于获取数据库密钥和位置的极简版本 pywxdumpmini。
  • 支持处理多个微信账户的场景,获取多用户的信息。

其典型适用场景包括但不限于网络安全研究、个人日常数据备份及归档、远程浏览聊天记录等。项目维护者也列出了未来的更新计划,例如聊天记录的统计分析和可视化、支持企业微信、朋友圈数据查看与备份、清理存储空间以及通过 UI 进行消息发送等更高级的功能。

项目主要使用 Python 语言开发,当前主要在 Windows 操作系统下测试和使用,对 macOS 和 Linux 的支持尚待完善。用户可以通过命令行方式运行该工具,同时也提供了基于 Vue+ElementUI 的 Web UI 用于数据查看。项目的详细使用方法可在 UserGuide.md 中找到。

PyWxDump 不依赖特定的 AI 模型提供商(如 Gemini, OpenAI, Azure OpenAI 等),它关注的是微信数据的获取、解密和导出,为后续的 AI 应用或其他处理提供数据基础。

该项目在 GitHub 上遵循特定的开源许可协议,并明确了一系列非常重要的免责声明,强调项目仅用于学习和交流,禁止用于非法用途,并要求用户在合理时限内删除代码副本,所有非法使用行为产生的后果由使用者自行承担。

总而言之,PyWxDump 是一个功能实用、面向开发者的工具,旨在赋予用户对其本地微信数据更多的控制和利用能力,尤其在数据分析、备份以及与第三方应用(如 AI 模型)集成方面具有潜在价值。

项目统计与信息

  • 作者: xaoyaoo
  • 主要语言: Python
  • Stars: 8027 ⭐
  • Forks: 1242 🍴
  • 本周期新增 Stars: 95 ⭐

要了解更多关于 xaoyaoo / PyWxDump 的信息、查看完整的贡献者列表或参与项目,请访问其 GitHub 仓库


virattt / ai-hedge-fund

这个项目通过模拟巴菲特等投资大师和不同分析方法的AI代理协作,探索AI在交易决策中的应用,提供策略回测功能,纯教育研究用途。

项目介绍

这是一个名为 "AI Hedge Fund" 的概念验证项目,旨在探索如何利用人工智能进行交易决策。该项目纯粹用于教育目的,不适用于真实的交易或投资。

其核心功能是通过一系列相互协作的智能代理(Agent)来模拟对冲基金团队的行为。这些代理各自拥有不同的投资理念和分析方法,模拟了现实世界中不同投资大师的策略,包括:

  • Aswath Damodaran 代理:专注于估值,考虑公司故事、财务数据和严谨的估值方法。
  • Ben Graham 代理:价值投资的奠基人,寻找具有安全边际的被低估股票。
  • Bill Ackman 代理:激进投资者风格,倾向于大胆持有头寸并推动管理层改变。
  • Cathie Wood 代理:成长投资代表,关注创新和颠覆性技术。
  • Charlie Munger 代理:强调以合理价格购买优秀企业。
  • Michael Burry 代理:逆向投资者,寻找深度价值机会。
  • Peter Lynch 代理:务实投资者,在日常生活中寻找“十倍股”。
  • Phil Fisher 代理:采用深度“闲聊”研究法的细致成长投资人。
  • Stanley Druckenmiller 代理:宏观交易传奇,寻找具有成长潜力的非对称机会。
  • Warren Buffett 代理:以合理价格寻找卓越公司。
  • 估值代理:计算股票内在价值并生成交易信号。
  • 情绪代理:分析市场情绪并生成交易信号。
  • 基本面代理:分析基本面数据并生成交易信号。
  • 技术面代理:分析技术指标并生成交易信号。
  • 风险管理器:计算风险指标并设置头寸限制。
  • 投资组合管理器:做出最终交易决策并生成订单。

该系统模拟交易决策过程,但不执行实际交易。它提供了回测功能,允许用户指定股票代码和日期范围来测试策略表现。

技术栈/依赖方面,项目主要使用 Python 语言。对大型语言模型(LLMs)有依赖,支持的提供商包括 OpenAI (如 gpt-4o, gpt-4o-mini)、Groq (如 deepseek, llama3) 以及本地运行的 Ollama 模型。获取金融数据需要 Financial Datasets API Key,但提供了 AAPL, GOOGL, MSFT, NVDA, TSLA 这五只股票的免费数据访问。项目还提供了 Docker 支持,方便环境搭建和部署。

安装与配置方面,用户可以通过 Poetry 或 Docker 进行安装。需要克隆仓库,安装依赖,并通过 .env 文件配置相应的 API Key (.env.example 文件提供了示例)。

基本使用方法包括运行主程序 (main.py) 来模拟对冲基金的决策过程,以及运行回测程序 (backtester.py) 来测试历史数据上的表现。可以通过命令行参数指定股票代码、运行起止日期,以及是否使用本地 Ollama 模型或打印代理的推理过程。

例如,使用 Poetry 运行指定股票的模拟决策:

poetry run python src/main.py --ticker AAPL,MSFT,NVDA

使用 Docker 运行指定时间段的回测:

./run.sh --ticker AAPL,MSFT,NVDA --start-date 2024-01-01 --end-date 2024-03-01 backtest

该项目适用于对AI在金融领域的应用感兴趣的开发者、研究人员以及希望通过模拟了解不同投资策略的个人。其独特的优势在于模拟了多种知名投资风格的代理,并将这些代理整合到一个协作系统中,提供了一个模块化和可扩展的框架来探索基于AI的投资决策。

项目采用 MIT 许可证。请注意这是一个学习和研究项目,不提供任何保证,不应用于实际投资。

项目统计与信息

  • 作者: virattt
  • 主要语言: Python
  • Stars: 27726 ⭐
  • Forks: 4796 🍴
  • 本周期新增 Stars: 354 ⭐

要了解更多关于 virattt / ai-hedge-fund 的信息、查看完整的贡献者列表或参与项目,请访问其 GitHub 仓库