Github Daily Trending
- 发布于
本期内容涵盖了GitHub上的多个热门开源项目,包括大型公共API集合、中国大陆教材资源库、YouTube Music桌面增强应用、功能强大的多平台视频下载工具yt-dlp、基于AI多代理的量化投资概念项目、LLM友好的网络爬取工具Crawl4AI、创新的无服务器PostgreSQL替代品Neon、本地部署的PDF多功能处理工具Stirling-PDF、开源金融数据平台OpenBB以及基于ESP芯片的智能家居固件Tasmota和开源游戏串流服务端Sunshine,和一个关于LLM工程的课程资源库。
public-apis / public-apis
该项目是一个收集和整理了大量免费公共API的资源库,开发者可以通过它轻松找到并使用各种领域的APIs。
项目介绍
该 GitHub 项目名为 "public-apis",其核心定位是一个收集和整理免费公共 API 列表的资源库,旨在为开发者提供一个便于发现和使用各类 API 的便捷平台。它是一个由社区成员和 APILayer 团队手动策划的宝库,包含了来自众多领域的可用于个人或产品开发的公共 API。
该项目的主要功能和特性包括:
- 提供了一个广泛的免费 API 列表,涵盖了动物、动漫、反恶意软件、艺术与设计、认证与授权、区块链、图书、商业、日历、云存储与文件分享、持续集成、加密货币、货币兑换、数据验证、开发工具、词典、文档与生产力、邮件、娱乐、环境、事件、金融、食品与饮料、游戏与漫画、地理编码、政府数据、健康、工作、机器学习、音乐、新闻、开放数据、开源项目、专利、个性化、电话、摄影、编程、科学与数学、安全、购物、社交、体育与健身、测试数据、文本分析、追踪、交通、URL 缩短以及天气等类别。
- 列表中的每个 API 条目通常包含 API 名称、描述、是否需要认证(Auth)、是否支持 HTTPS 以及是否支持 CORS 等关键信息。
- 提供链接指向每个 API 的详细文档,帮助用户了解如何调用和使用这些 API。
- 仓库结构清晰,通过
README.md
文件组织所有内容,并提供了快速导航到不同 API 类别的索引。 - 项目采用 MIT 许可证,鼓励开放和自由使用。
- 项目积极接受社区贡献,提供了贡献指南(CONTRIBUTING.md),鼓励用户提交新的 API 或改进现有列表。
该项目技术栈主要体现在组织和呈现列表内容,核心信息存储在 Markdown 文件(README.md
)中,通过 GitHub 的版本控制进行管理和协同。没有复杂的应用技术栈,主要依赖于 GitHub 平台本身的功能以及一些辅助脚本(如 scripts
目录下的文件)。
虽然项目本身不提供 API,而是作为API列表的集合,但其安装和使用方法概述如下:
- 安装配置: 用户无需安装或配置任何软件即可查阅列表内容。开发者若想贡献,则需要克隆仓库,并在本地编辑 Markdown 文件后提交。
- 基本使用方法: 用户可以直接访问 GitHub 页面,通过 README 文件中的索引或滚动浏览来查找他们感兴趣的 API。每个 API 条目旁的链接会引导用户访问该 API 的官方文档或网站。
该项目适用于需要集成第三方数据或功能的开发者、学生、研究人员以及任何对各类免费开放 API 感兴趣的技术用户。它解决了寻找可靠、免费公共API的痛点,尤其是在原型开发、学习新技术或构建测试应用时具有很高价值。
项目的独特优势在于其庞大且不断更新的免费公共 API 集合,涵盖领域极广,并且是社区驱动的,能够及时反映新增和失效的 API。MIT 许可证也使得信息可以被自由地复制和分发。
项目统计与信息
- 作者: public-apis
- 主要语言: Python
- Stars: 342922 ⭐
- Forks: 36102 🍴
- 本周期新增 Stars: 1528 ⭐
要了解更多关于 public-apis / public-apis 的信息、查看完整的贡献者列表或参与项目,请访问其 GitHub 仓库。
TapXWorld / ChinaTextbook
这是一个开源项目,收集了中国大陆地区小学、初中、高中及大学的PDF教材,旨在普及教育、消除不均衡并方便获取。
项目介绍
这是一个名为 "ChinaTextbook"r 的 GitHub 项目。其核心定位是收集并开源中国大陆地区所有小学、初中、高中及大学的 PDF 教材。
项目主要目标是促进义务教育的普及,消除地区间的教育资源不均衡,并为海外华人提供了解国内教育的机会。项目发起人认为,虽然官方有免费资源,但获取途径对普通人仍有限制,且存在有人倒卖免费资源的情况,因此选择开源共享这些教材。
该项目的主要功能是提供免费的教育资源下载。目前项目仓库内提供了包括小学、初中(包括五•四学制)、高中和大学的数学教材 PDF 文件。
在技术栈或依赖方面,项目本身主要是通过文件组织和分享来实现,不涉及复杂的编程技术。但由于 GitHub 对单文件大小有限制,项目提供了一个用于合并被拆分 PDF 文件的额外程序,名称为 mergePDFs-windows-amd64.exe
,通过一个单独的 GitHub Releases 页面进行下载。
使用方法概述:用户可以直接在 GitHub 仓库中浏览不同学段和学科的文件夹,点击对应的 PDF 文件链接进行在线查看或下载。对于因文件过大而被拆分成多个部分的文件,用户需要下载提供的合并程序,并将其与所有分卷文件放在同一目录下运行,以还原完整的 PDF 教材。
适用场景和目标用户:
- 希望获取免费中小学、大学教材 PDF 的学生、家长和教师。
- 资源获取受限地区或人群。
- 希望了解和使用中国大陆教育体系教材的海外华人。
- 推广开放教育资源的倡导者。
项目状态:根据 GitHub 页面信息,项目持续更新中(有历史提交记录),并拥有相当数量的 Stars 和 Forks,表明其受到广泛关注。具体的许可证信息在提供的内容中没有明确提及。
项目鼓励用户进行教材捐献,同时也提供了支持项目的方式(通过扫描二维码捐赠),并设有 Telegram 社区供用户交流。对于身处内地且网络条件较好的用户,项目推荐使用另一个开源项目 tchMaterial-parser
进行重新下载教材。
项目统计与信息
- 作者: TapXWorld
- 主要语言: Roff
- Stars: 23939 ⭐
- Forks: 4761 🍴
- 本周期新增 Stars: 2058 ⭐
要了解更多关于 TapXWorld / ChinaTextbook 的信息、查看完整的贡献者列表或参与项目,请访问其 GitHub 仓库。
th-ch / youtube-music
这是一个基于Electron的YouTube Music桌面增强应用,提供原生体验、广告拦截、下载等功能,并支持丰富的插件和自定义设置。
项目介绍
本项目是一个基于 Electron 技术的 YouTube Music 桌面应用程序,其核心定位是提供一个具有原生应用体验、且高度可定制的 YouTube Music 客户端。它旨在通过内置功能和丰富的插件系统,解决官方 Web 版本的一些不足,如广告干扰和功能限制,为用户提供更增强的音乐播放体验。
主要功能和特性包括:
- 原生外观与体验:力求保持原版 YouTube Music 页面的风格,同时提供桌面应用的流畅感。
- 插件系统:支持自定义插件,允许用户根据个人需求修改应用的样式、内容和功能,实现高度个性化。插件可以方便地启用或禁用。
- 内置广告拦截:无需额外设置即可屏蔽广告和跟踪。
- 下载功能:支持直接从界面下载 MP3 格式的音频文件,基于
youtube-dl
技术。 - 播放控制增强:提供精确音量控制、指数级音量滑块、播放速度调节等功能。
- 界面优化:紧凑侧边栏、导航栏模糊效果、视频质量调节按钮、视频/音乐模式切换按钮等。
- 通知与集成:支持歌曲播放通知(Windows 上支持交互式通知)、Discord Rich Presence 显示当前播放、Scrobbling 集成(Last.fm, ListenBrainz)、Lumia Stream 支持等。
- 快捷键与媒体控制:支持全局快捷键控制播放、禁用媒体 OSD(屏幕显示)、搜索快捷键以及 Linux MPRIS 支持。
- 歌词功能:提供 Genius 歌词支持,以及基于 LRClib 等提供商的同步歌词功能(含罗马化选项)。
- 社交功能:音乐共享功能,允许与他人同步播放同一歌单。
- 其他实用功能:自动确认暂停(禁用“继续观看?”提示)、跳过不喜欢的歌曲、跳过静音片段、SponsorBlock 集成(跳过非音乐部分)、绕过年龄限制、画中画模式、任务栏媒体控制(Windows)、macOS TouchBar 支持、Tuna OBS 集成、移除 Google 登录按钮等。
技术栈:项目使用 Electron 构建,是一个 Node.js 应用程序,大量使用 TypeScript 和 JavaScript 进行开发。前端样式通过 CSS 进行控制,并利用 Vite 构建工具。播放器核心功能仍依赖于 YouTube Music 的 Web 界面,但通过 Electron 和插件系统在其上进行增强和修改。
安装与配置:支持在 Arch Linux、macOS 和 Windows 系统上安装。Arch Linux 用户可通过 AUR 安装 youtube-music-bin
包;macOS 用户可使用 Homebrew Cask 安装,或手动下载并解决权限问题;Windows 用户可使用 Scoop 或 Winget 等包管理器安装,也支持离线安装。安装后可在应用设置中管理各种插件。
基本使用:应用启动后显示 YouTube Music 界面,用户可以通过集成的各项功能和插件定制体验。例如,可以通过内置按钮进行播放控制、下载音乐、切换视频模式等;通过设置面板启用/禁用插件以调整功能或界面表现。
适用场景与目标用户:适合那些希望在桌面环境下获得更纯净、功能更丰富的 YouTube Music 体验的用户。尤其是那些对广告感到厌烦、需要离线下载功能、追求自定义界面和播放控制,或者希望与其他应用(如 Discord, Last.fm, OBS)进行集成的用户。这主要面向普通用户以及希望通过插件代码进行定制的开发者。
项目状态与许可证:项目活跃维护中,根据提交记录显示更新频繁。项目采用 MIT 许可证。
项目统计与信息
- 作者: th-ch
- 主要语言: TypeScript
- Stars: 20534 ⭐
- Forks: 1067 🍴
- 本周期新增 Stars: 343 ⭐
要了解更多关于 th-ch / youtube-music 的信息、查看完整的贡献者列表或参与项目,请访问其 GitHub 仓库。
yt-dlp / yt-dlp
yt-dlp 是一个功能强大的命令行工具,基于 youtube-dl 分支开发,能够从数千个网站下载音视频内容,并提供丰富的格式控制和后处理功能。
项目介绍
yt-dlp 是一个功能丰富的音频/视频命令行下载工具,支持从数千个网站下载内容。该项目是 youtube-dl 的一个分支,并基于现已不再活跃的 youtube-dlc。
项目核心定位是提供一个强大、灵活且支持广泛网站的命令行媒体下载解决方案,是 youtube-dl 和 youtube-dlc 的增强版。
主要功能和特性:
- 支持下载数千个网站上的音频和视频。
- 集成了 SponsorBlock 功能,可标记或移除 YouTube 视频中的赞助商、片头、片尾等片段。
- 改进了格式选择和排序功能,可以更精细地控制下载视频的质量、编码、容器等属性,支持复杂的格式筛选和自定义排序规则。
- 增强了 YouTube 支持,包括下载 Clips、Stories、搜索结果(含过滤)、YouTube Music 搜索、特定频道搜索、Mixes 和 Feeds。
- 支持从主流浏览器自动导入 Cookies,简化需要登录下载的场景。
- 支持按时间范围或章节分段下载视频。
- 支持按章节将视频分割成多个文件。
- 支持多线程下载分段视频(如 DASH/HLS),显著提升下载速度。
- 支持将
aria2c
作为外部下载器处理 DASH/HLS 格式。 - 增加了对许多新网站的支持,并修复了现有提取器。
- 支持多个输出路径和文件名模板,可以为不同类型的文件(如视频、字幕、缩略图、信息文件等)设置不同的保存位置和命名规则。
- 支持将配置选项写入配置文件,简化常用配置。
- 改进了输出模板语法,支持日期格式化、数值偏移、对象遍历等高级功能。
- 提供了通过
--parse-metadata
和--replace-in-metadata
选项修改下载视频元数据的功能。 - 支持通过插件扩展功能,可加载外部开发的提取器和后处理程序。
- 提供了自更新功能,可以轻松更新到稳定版、每夜版(推荐日常用户)或 Master 版。
- 提供了 Python API,方便其他程序嵌入使用。
技术栈/依赖:
- 基于 Python 语言开发,支持 Python 3.9+ (CPython) 和 3.10+ (PyPy)。
- 强烈推荐安装 ffmpeg 和 ffprobe 用于格式合并、后处理等功能。项目还提供了定制编译的 ffmpeg 构建版本,修复了一些与 yt-dlp 配合使用时的已知问题。
- 其他可选依赖包括 certifi (SSL 证书)、brotli/brotlicffi (Brotli 解码)、websockets (WebSocket 下载)、requests (HTTP 请求)、curl_cffi (模拟浏览器请求)、mutagen/AtomicParsley/xattr/pyxattr/setfattr (元数据写入)、pycryptodomex (加密解密)等。
安装与配置指南概述:
- 用户可以通过下载发布的可执行文件(Windows, Linux, MacOS 各平台提供对应版本)、使用 pip 或第三方包管理器进行安装。
- 详细安装指南可在项目的 Wiki 中找到。
- 可通过在指定位置放置
yt-dlp.conf
文件进行配置,配置文件支持注释和环境变量。 - 支持使用
.netrc
文件或--netrc-cmd
进行需要认证的网站的凭据管理。
基本使用方法概述:
- yt-dlp 是一个命令行工具,基本语法为
yt-dlp [OPTIONS] [--] URL [URL...]
。 - 用户通过各种命令行选项来控制下载行为、文件格式、输出路径、后处理等。
- 例如,使用
-f
选择格式,-o
设置输出文件名模板,-x
提取音频,-U
更新程序。
代码示例/命令示例:
- 下载指定视频:
yt-dlp https://www.youtube.com/watch?v=BaW_jenozKc
- 下载并合并最佳画质和音质:
yt-dlp -f "bv*+ba/b" URL
(这通常是默认行为,无需额外指定) - 下载特定格式:
yt-dlp -f 22 URL
- 提取音频并转为 mp3 格式:
yt-dlp -x --audio-format mp3 URL
- 下载播放列表并将文件按顺序保存在以播放列表标题命名的文件夹中:
yt-dlp -o "%(playlist)s/%(playlist_index)s - %(title)s.%(ext)s" PLAYLIST_URL
适用场景/目标用户:
- 需要从各种在线平台下载音视频内容的用户。
- 对下载格式、质量有精细控制需求的爱好者或专业人士。
- 需要批量下载、从播放列表下载、下载特定时间片段的用户。
- 希望集成媒体下载功能到自己程序中的开发者。
项目状态与许可证:
- 项目活跃更新,持续增加新功能、修复问题并支持更多网站。
- 采用 Unlicense 许可证,这意味着代码处于公共领域,用户可自由使用、修改和分发,没有任何限制。
项目统计与信息
- 作者: yt-dlp
- 主要语言: Python
- Stars: 112286 ⭐
- Forks: 8825 🍴
- 本周期新增 Stars: 121 ⭐
要了解更多关于 yt-dlp / yt-dlp 的信息、查看完整的贡献者列表或参与项目,请访问其 GitHub 仓库。
virattt / ai-hedge-fund
这是一个基于AI多代理模拟不同投资大师风格和分析方法进行股票交易决策的概念验证项目,仅用于教育研究,不应用于真实投资,并提供了安装、使用和回测方法。
项目介绍
该项目是一个关于人工智能驱动对冲基金的概念验证,旨在探索利用AI进行股票交易决策的可能性。请注意,该项目仅用于教育和研究目的,不应用于真实的交易或投资活动。
该系统通过模拟一个包含多个AI代理的团队来运作,每个代理负责不同的投资策略或分析维度。这些代理包括:
- Aswath Damodaran Agent:专注于公司故事、财务数字和严谨估值。
- Ben Graham Agent:价值投资倡导者,寻找具有安全边际的被低估股票。
- Bill Ackman Agent:激进投资者,倾向于大胆持仓并推动公司变革。
- Cathie Wood Agent:成长股投资女王,信奉创新和颠覆的力量。
- Charlie Munger Agent:强调只购买“好生意”且价格合理。
- Michael Burry Agent:以“大空头”闻名,寻找深度价值机会。
- Peter Lynch Agent:注重实际,寻找“十倍股”。
- Phil Fisher Agent:严谨的成长股投资者,进行深入调研分析。
- Stanley Druckenmiller Agent:宏观投资大师,寻找不对称的增长机会。
- Warren Buffett Agent:股神,寻找优秀的公司并以合理价格买入。
- Valuation Agent:计算股票内在价值并生成交易信号。
- Sentiment Agent:分析市场情绪并生成交易信号。
- Fundamentals Agent:分析基本面数据并生成交易信号。
- Technicals Agent:分析技术指标并生成交易信号。
- Risk Manager:计算风险指标并设定头寸限制。
- Portfolio Manager:根据其他代理的分析做出最终交易决定并生成指令。
项目的主要功能包括:
- 模拟基于多个AI代理的投资决策过程。
- 提供根据不同投资大师风格设计的代理模型。
- 进行股票的估值、情绪、基本面和技术面分析。
- 包含风险管理和投资组合管理功能。
- 支持回测功能,用于在历史数据上模拟策略表现。
项目基于 Python 和 TypeScript 技术栈构建。它支持多种大型语言模型(LLMs)提供商,包括需要API密钥的OpenAI、Groq、Anthropic、DeepSeek,以及支持本地运行的Ollama模型。获取金融数据需要Financial Datasets API密钥,但对于AAPL、GOOGL、MSFT、NVDA和TSLA这几只股票提供免费数据支持。
项目的安装和配置可以通过 Poetry 或 Docker 进行。使用前需要克隆代码库,安装依赖(Poetry)或构建Docker镜像(Docker),并配置包含相应API密钥的环境变量文件(.env
)。
使用方法主要是通过命令行运行src/main.py
(模拟对冲基金决策)或src/backtester.py
(回测)。可以通过命令行参数指定交易的股票代码列表(--ticker
),可选的历史日期范围(--start-date
, --end-date
),以及是否使用本地的Ollama模型(--ollama
)和是否显示代理的推理过程(--show-reasoning
)。
该项目适用于对AI、投资决策自动化、多代理系统或量化交易感兴趣的开发者和研究人员。代码结构清晰,代理定义、工具和核心逻辑分别置于 src/agents
和 src/tools
目录下。
项目采用 MIT 开源许可证。
免责声明再次强调:此项目仅供学习和研究使用,不构成任何投资建议。项目的表现不代表未来收益,使用者应自行承担所有风险。
项目统计与信息
- 作者: virattt
- 主要语言: Python
- Stars: 28268 ⭐
- Forks: 4897 🍴
- 本周期新增 Stars: 254 ⭐
要了解更多关于 virattt / ai-hedge-fund 的信息、查看完整的贡献者列表或参与项目,请访问其 GitHub 仓库。
unclecode / crawl4ai
Crawl4AI是一个开源的、对LLM友好的网络爬虫和抓取工具,专门为AI应用提供快速、高质量的网页数据,旨在克服传统工具局限并推动数据开放与AI民主化。
项目介绍
Crawl4AI 是一个开源的、对大型语言模型(LLM)友好的网络爬虫和抓取工具,旨在为 LLMs、AI 代理和数据管道提供快速、AI就绪的网页数据。该项目目前是 GitHub 上的热门趋势项目,由活跃的社区维护。它强调速度、精度、部署灵活性以及与 AI 集成的便捷性。
该项目的核心定位是克服传统网页抓取工具在面对动态网站和为 AI 应用准备数据时的局限性,特别是解决数据获取受限于付费 API 或 SaaS 平台的痛点,致力于实现数据的开放获取和 AI 的民主化。
Crawl4AI 的主要功能和特性包括:
- 友好的 Markdown 生成:能生成干净、结构化的 Markdown 内容,并通过启发式过滤(如 BM25 算法)去除噪音和不相关部分,优化 RAG(检索增强生成)和微调应用。支持引用和参考列表生成,并允许自定义生成策略。
- 结构化数据提取:
- 支持各种 LLM(开源和私有)进行结构化数据提取。
- 提供多种分块策略(主题、正则、句子级)进行内容处理。
- 利用余弦相似度根据用户查询定位相关内容。
- 支持基于 XPath 和 CSS 选择器的快速结构化数据提取。
- 允许定义 JSON Schema 来提取重复模式的数据。
- 新增了 RegexExtractionStrategy,支持基于模式的快速数据提取,内置常见数据类型模式,并支持自定义正则和 LLM 辅助模式生成。
- 强大的浏览器集成:
- 支持使用用户本地浏览器,具备完整的控制能力,可避免 Bot 检测。
- 可通过 Chrome Developer Tools Protocol 进行远程控制。
- 具备浏览器配置文件管理,保存用户数据、Cookies 和设置。
- 会话管理功能允许复用浏览器状态。
- 支持代理和认证。
- 提供全面的浏览器控制选项(headers, cookies, user agents 等)。
- 兼容 Chromium, Firefox 和 WebKit 等多种浏览器。
- 能自动调整视口以完整渲染和捕获所有元素。
- 新增浏览器池化功能,预热浏览器实例,降低延迟和内存使用。
- 新增 World-aware Crawling,支持设置地理位置、语言和时区。
- 全面的抓取与爬取能力:
- 支持提取多媒体(图片、音频、视频)和
srcset
等响应式图片格式。 - 支持执行 JavaScript 等动态内容加载。
- 可截取页面截图。
- 支持处理原始 HTML (
raw:
) 和本地文件 (file://
)。 - 具备全面的链接提取能力,包括内部、外部链接和 iframe 内容。
- 允许自定义钩子函数以定制抓取行为。
- 支持数据缓存以提高速度并避免重复抓取。
- 提取页面元数据。
- 无缝提取 iframe 内容。
- 处理懒加载内容,确保完整数据捕获。
- 全页面扫描模拟滚动,抓取动态加载内容,适用于无限滚动页面。
- 新增网络请求和控制台消息捕获功能。
- 新增将 HTML 表格直接提取为 CSV 或 Pandas DataFrame 的功能。
- 支持提取多媒体(图片、音频、视频)和
- 灵活的部署选项:
- 提供优化的 Docker 镜像,内置 FastAPI 服务器,方便部署。
- 支持 JWT token 认证保障 API 安全。
- 一键式 API Gateway 部署。
- 设计为可扩展架构,适用于大规模生产环境。
- 支持主要的云平台部署。
- 新增交互式 Playground,用于测试配置和生成请求代码。
- 新增 MCP (Model Context Protocol) 集成,可以直接连接到 Claude Code 等 AI 工具。
- 其他功能:隐身模式、基于标签的内容提取、链接分析、健壮的错误处理、文件系统缓存、CORS 和静态服务支持等。
技术栈和依赖方面,Crawl4AI 主要基于 Python,核心异步爬取使用 Playwright,也支持已废弃的同步 Selenium。依赖 Litellm 库支持多种 LLM 提供商(例如 OpenAI, Ollama, Grok, Azure OpenAI 等)。数据提取支持基于 CSS/XPath 的非 LLM 方式和基于 LLM 的方式。最新的 Docker 版本升级到 Python 3.12。项目使用 Apache 2.0 许可证,并包含了归属条款要求。
安装通常通过 pip 完成,提供基本、同步(已废弃)和开发模式安装。异步版本需要安装 Playwright 浏览器。项目也提供 Docker 镜像部署方式,并针对 v0.6.0 版本进行了大幅重构和优化。
基本使用涵盖 Python 调用和命令行接口 (crwl
)。命令行支持基本抓取、深度抓取和 LLM 辅助提取等功能。Python API 提供了高度的模块化和可配置性,允许用户通过配置类 (BrowserConfig
, CrawlerRunConfig
) 和策略模式 (MarkdownGenerationStrategy
, ExtractionStrategy
) 定制行为,例如使用特定过滤器、执行 JavaScript 或配置 LLM 提取任务。
Crawl4AI 适用于需要从网络获取高质量、结构化数据的多种场景,特别是为 LLMs 提供预处理数据用于 RAG、微调或信息提取任务。目标用户包括开发者、研究人员以及构建 AI 应用和数据管道的团队。其独特的优势在于为 AI 优化数据输出格式(Markdown),提供强大的浏览器控制能力以应对复杂网页,并支持多种数据提取策略及灵活的部署方式,同时作为开源项目提供了成本效益高、透明可控的解决方案。
项目统计与信息
- 作者: unclecode
- 主要语言: Python
- Stars: 43467 ⭐
- Forks: 4031 🍴
- 本周期新增 Stars: 92 ⭐
要了解更多关于 unclecode / crawl4ai 的信息、查看完整的贡献者列表或参与项目,请访问其 GitHub 仓库。
ventoy / Ventoy
Ventoy是一款开源工具,只需将各种镜像文件复制到U盘即可制作多系统启动盘,操作简单,支持广泛的操作系统和多种高级功能,非常适合需要频繁处理不同系统镜像的用户。
项目介绍
Ventoy 是一个开源工具,致力于彻底改变可启动 USB 驱动器的创建方式。传统的做法是反复格式化 U 盘来写入不同的镜像文件,而 Ventoy 只需要将 ISO、WIM、IMG、VHD(x) 或 EFI 文件直接复制到 Ventoy 制作好的 U 盘中即可。Ventoy 会自动提供一个启动菜单供用户选择并启动这些镜像文件。用户也可以直接浏览本地硬盘中的这些镜像文件并启动。
项目的主要功能和特性包括:
- 简单易用:只需将镜像文件复制到 U 盘即可使用。
- 高效率:启动速度仅受限于 U 盘自身的读写速度。
- 广泛的安装兼容性:可安装到 USB 闪存盘、本地硬盘、SSD、NVMe 或 SD 卡上。
- 直接启动:无需提取镜像文件内容,直接从原始文件启动。
- 文件连续性要求低:镜像文件在磁盘上无需连续存储。
- 支持多种分区风格:同时支持 MBR 和 GPT 分区(版本 1.0.15+)。
- 全面的体系结构支持:支持 x86 Legacy BIOS、IA32 UEFI、x86_64 UEFI、ARM64 UEFI 和 MIPS64EL UEFI。
- 支持安全启动:兼容 IA32/x86_64 UEFI 安全启动(版本 1.0.07+)。
- 数据持久化:支持 Linux 系统的持久化存储(版本 1.0.11+)。
- 自动化安装:支持 Windows 和 Linux 的自动安装(版本 1.0.09+),并支持变量扩展。
- 宽泛的文件系统兼容性:主分区支持 FAT32、exFAT、NTFS、UDF、XFS 和 Ext2(3)(4) 文件系统。
- 支持大文件:支持大于 4GB 的 ISO 文件。
- 自定义选项:提供菜单别名、菜单提示信息、密码保护以及高度可定制的主题和菜单。
- 多种启动模式:支持原生启动菜单风格、列表/树状视图菜单切换、Memdisk 模式等。
- 广泛的操作系统支持:已测试支持 1200+ ISO 文件,涵盖 DistroWatch.com 上 90%+ 的发行版,包括 Windows、WinPE、Linux、Unix、ChromeOS 以及 VMware、Xen 等多种类型的系统镜像。
- 虚拟硬盘启动:支持 Linux 的 vDisk (.vtoy) 文件启动以及 Windows 的 VHD(x) booting。
- 插件框架和图形化配置工具:提供 VentoyPlugson 用于图形化配置各种插件。
- 运行时环境文件注入:支持向启动的运行时环境注入文件。
- 启动配置动态替换:支持动态替换启动配置文件。
- U 盘写保护:支持在 U 盘上启用写保护。
- 不影响 U 盘日常使用:Ventoy 安装后,U 盘剩余空间仍可用于存储普通文件。
- 版本升级数据无损:升级 Ventoy 时不会丢失 U 盘上的数据。
- 无需针对新发行版更新:新的操作系统或发行版发布时,通常无需更新 Ventoy 即可直接使用其镜像文件。
Ventoy 提供方便的安装指南,用户可访问官方网站获取详细步骤。项目也提供从源代码编译的说明。
Ventoy 适用于需要频繁安装或启动不同操作系统的用户,例如系统管理员、技术支持人员、开发者以及普通电脑用户,尤其对于需要制作多系统启动盘或 PE 启动盘的场景非常有用。
项目采用 GPL-3.0 许可证开源。用户可以通过支付宝、微信支付、PayPal 或比特币等方式向项目进行捐赠,以支持其持续发展。
项目统计与信息
- 作者: ventoy
- 主要语言: C
- Stars: 66798 ⭐
- Forks: 4279 🍴
- 本周期新增 Stars: 26 ⭐
要了解更多关于 ventoy / Ventoy 的信息、查看完整的贡献者列表或参与项目,请访问其 GitHub 仓库。
f / awesome-chatgpt-prompts
这是一个收集了大量ChatGPT等大语言模型提示语的项目,用户可以通过这些提示扮演各种专业角色或进行特定任务交互,从而更高效地使用AI工具来提升效率和创造力。
项目介绍
项目标题为 "Awesome ChatGPT Prompts",其核心定位是一个精选的 ChatGPT 和其他大型语言模型(LLMs)提示语集合,旨在帮助用户更好地利用这些AI工具。
该项目的主要功能和特性在于提供一系列精心设计的提示语,这些提示语覆盖了广泛的场景和角色扮演,例如:
- 模拟各种专业角色:如以太坊开发者、Linux终端、英文翻译及改进者、面试官、JavaScript控制台、Excel表格、英语发音助手、口头英语老师、旅行向导、剽窃检查器等。
- 创作和艺术类角色:如广告文案、故事讲述者、足球评论员、脱口秀喜剧演员、作曲家、辩论者、编剧、小说家、电影评论家、诗人、说唱歌手、艺术家顾问、室内装饰师、花艺师、ASCII艺术家、音乐视频设计师等。
- 咨询和帮助类角色:如励志教练、哲学老师、数学老师、AI写作导师、UX/UI开发者、网络安全专家、招聘人员、人生导师、词源学家、评论员、魔术师、职业顾问、宠物行为矫正师、私人教练、心理健康顾问、房产中介、物流师、牙医、网页设计顾问、AI辅助医生、医生、会计师、厨师、汽车修理师、金融分析师、投资经理、品茶师、自助书籍、小矮人学家、警句集、梦境解说员、填空练习生成器、软件质量保证测试员、密码生成器、莫尔斯电码翻译器、学校教师、SQL终端、营养师、心理学家、智能域名生成器、科技评论员、开发者关系顾问、学术研究者、IT架构师、疯癫之人、煤气灯操纵者、谬论发现者、期刊审稿人、DIY专家、社交媒体影响者、苏格拉底、带有苏格拉底方法的提示、教育内容创作者、瑜伽教练、论文写手、社交媒体经理、演说家、科学数据可视化专家、汽车导航系统、催眠治疗师、历史学家、占星师、电影评论员、古典音乐作曲家、记者、数字艺术画廊向导、公共演讲教练、化妆师、保姆、技术写作者。
- 技术交互和模拟类角色:如文字冒险游戏、尝试逃离盒子的AI、精美标题生成器、统计学家、提示语生成器、提示语增强器、Midjourney提示语生成器、Tic-Tac-Toe游戏、虚拟医生、SQL终端、R编程解释器、Python解释器、Php解释器、任何编程语言到Python转换器。
- 特定工具或平台模拟:如StackOverflow帖子、Emoji翻译器、Web浏览器、资深前端开发者、代码审阅者、可访问性审计员、Solr搜索引擎、Github专家、DAX终端。
- 其他创意和实用角色:如创业想法生成器、新语言创造者、《海绵宝宝》神奇扇贝、语言检测器、销售员、提交信息生成器、首席执行官、图表生成器、旅行建议顾问、数据科学家、英雄联盟玩家、餐厅老板、建筑专家、LLM研究员、单元测试助手、智慧生成器、YouTube视频分析师、国际象棋玩家、搭讪男孩、梦中女孩、应急响应专业人员、比特币价格预测器、求职信、技术转移员、不受限制的AI模型(DAN)、围棋玩家、校对员、佛陀、穆斯林伊玛目、化学反应容器、朋友、ChatGPT提示语生成器(多种形式)、维基百科页面、日本汉字测验机、笔记助手、文学评论家、学习规划师、SEO专家、营养师、是/否回答、治愈系奶奶、带有混淆功能的重述器、大型语言模型安全专家、技术故障排除员、阿育吠陀食物测试员、虚拟活动策划师、Linkedin鬼推手、DevOps工程师、Linux脚本开发者、知识渊博的软件开发导师、逻辑构建工具、猜谜游戏大师、React.js教师、虚拟健身教练。
项目中还包含了一些关于如何编写有效提示语的指导,并链接了相关的电子书资源(如《The Art of ChatGPT Prompting》、《How to Make Money with ChatGPT》和《The Art of Midjourney AI》)。项目提供了一个可视化界面 prompts.chat
,便于用户浏览、编辑和复制提示语。
该项目的技术栈主要包含 HTML、CSS 和 JavaScript,用于构建和展示这些提示语。它支持多种AI模型,包括 ChatGPT (OpenAI)、Claude、Gemini、Hugging Face Chat、Llama、Mistral等。
安装与配置方面,该项目主要是一个静态内容库,用户可以通过克隆GitHub仓库来获取所有提示语。并没有复杂的安装或配置过程,主要的使用方式是将仓库中的提示语复制粘贴到支持的大型语言模型界面中进行交互。 README文件中也提供了一些简单的脚本(位于 scripts
文件夹),用于搜索提示语。
典型的使用场景是个人用户或开发者,他们希望通过高质量的提示语来提升与LLMs互动时的效率和创造力,实现特定的任务或角色扮演。例如,用户可以复制一个“Act as an English Translator and Improver”的提示,然后在ChatGPT中扮演这一角色,向其输入需要翻译或改进的文本。
该项目目前处于活跃开发状态,社区贡献者不断通过Pull Request添加新的提示语。项目采用 CC0-1.0许可证,意味着代码和内容可以自由复制、修改、分发和使用,无需许可。
项目独特的优势在于其庞大且不断增长的高质量、分类明确的提示语库,为用户提供了丰富的可能性,极大地降低了用户自行探索和优化提示语的成本。同时,社区驱动的模式保证了提示语的多样性和实用性。
项目统计与信息
- 作者: f
- 主要语言: JavaScript
- Stars: 124939 ⭐
- Forks: 16694 🍴
- 本周期新增 Stars: 253 ⭐
要了解更多关于 f / awesome-chatgpt-prompts 的信息、查看完整的贡献者列表或参与项目,请访问其 GitHub 仓库。
neondatabase / neon
这份内容介绍了开源项目 Neon,这是一个无服务器的 PostgreSQL 替代品,其核心特点是分离存储与计算,提供自动伸缩、代码式数据库分支和缩容到零等能力。
项目介绍
以下是关于 GitHub 项目 Neon 的详细中文摘要:
Neon 是一个开源的无服务器 PostgreSQL 替代方案。它通过分离存储和计算,提供自动伸缩、类似代码的分支(Branching)以及按需缩容到零(Scale to Zero)的能力。
项目核心在于其创新的架构,将传统的 PostgreSQL 存储层分离并分布式部署。这使得计算节点(Compute Nodes)成为无状态的 PostgreSQL 实例,由 Neon 存储引擎支持。
Neon 存储引擎主要由两个关键组件组成:
- Pageserver: 可伸缩的存储后端,为计算节点提供数据服务。
- Safekeepers: 负责接收来自计算节点的 WAL(Write-Ahead Log),并将其持久存储,直到 Pageserver 处理并上传至云存储,从而提供冗余的 WAL 服务。
主要功能和特性包括:
- 存储与计算分离: 这是 Neon 的核心设计,带来了诸多优势。
- 自动伸缩: 能够根据负载需求自动调整计算资源。
- 代码式数据库分支(Branching): 允许用户创建数据库的轻量级、可写副本,就像代码仓库的分支一样,这对于开发、测试、CI/CD 以及数据分析等场景非常有用,提供了一种高效且成本低廉的数据管理方式。
- 缩容到零: 当没有活跃连接时,计算资源可以完全关闭,节省成本。
- 兼容 PostgreSQL: 作为 PostgreSQL 的替代方案,它努力保持与 PostgreSQL 的兼容性,可以使用标准的 PostgreSQL 客户端(如 psql, dbeaver)进行连接和操作。
技术栈/依赖:
- 主要使用 Rust 语言进行开发。
- 核心基于 PostgreSQL,并对其存储层进行了改造。
本地开发环境和构建指南概述:
- 项目提供了在 Linux 和 macOS 上安装依赖(包括 build-essential, libtool, libreadline-dev, zlib1g-dev, flex, bison, libseccomp-dev, libssl-dev, clang, pkg-config, libpq-dev, cmake, postgresql-client, protobuf-compiler, libprotobuf-dev, libcurl4-openssl-dev, openssl, python3-poetry, lsof, libicu-dev 等)和构建 Neon 的详细步骤。
- 需要安装 Rust 并使用项目指定的 rust toolchain 版本。
- 需要安装 PostgreSQL 客户端 和 Python 3.11+ 及相关库(通过
poetry
管理)。 - 构建过程涉及克隆项目并编译其组件和修改过的 PostgreSQL。
基本使用方法概述(在本地开发环境中):
- 使用
cargo neon init
初始化仓库。 - 使用
cargo neon start
启动 Pageserver, Safekeeper, 和 Broker 服务。 - 使用
cargo neon tenant create --set-default
创建初始租户。 - 使用
cargo neon endpoint create [endpoint_name]
创建计算节点。 - 使用
cargo neon endpoint start [endpoint_name]
启动計算節點,並提供連接地址。 - 使用标准的
psql
等客户端连接到运行中的计算节点进行数据库操作。 - 使用
cargo neon timeline branch --branch-name [branch_name]
创建新的数据库分支。 - 在不同分支上创建和启动计算节点,演示数据隔离和分支能力。
- 使用
cargo neon stop
停止所有运行的 Neon 组件实例。
测试方法概述:
- 支持 Rust 单元测试,推荐使用
cargo-nextest run
运行。 - 支持集成测试,需要安装额外的依赖并通过
./scripts/pytest
脚本运行,可以指定构建类型和 PostgreSQL 版本。
适用场景/目标用户:
- 寻求无服务器、弹性伸缩且成本效益高的 PostgreSQL 数据库解决方案的开发者和组织。
- 需要频繁进行数据库分支操作的开发工作流(如 Feature 分支、CI/CD 环境)。
- 对自动伸缩和按需付费的特性感兴趣的用户。
项目状态与许可证:
- 项目处于活跃开发状态,不断有新的提交和版本发布。
- 项目遵循 Apache-2.0 License 开源许可证,允许自由使用、修改和分发。
独特的优势或创新点:
- 彻底分离存储和计算,是其区别于传统数据库和许多云数据库的关键创新。
- 原生支持数据库分支,提供了类似于 Git 的数据管理体验。
- 无服务器架构带来的自动化伸缩和成本优化。
项目统计与信息
- 作者: neondatabase
- 主要语言: Rust
- Stars: 17934 ⭐
- Forks: 630 🍴
- 本周期新增 Stars: 185 ⭐
要了解更多关于 neondatabase / neon 的信息、查看完整的贡献者列表或参与项目,请访问其 GitHub 仓库。
Stirling-Tools / Stirling-PDF
Stirling-PDF 是一个基于 Docker 的自托管 Web 应用,提供 50 多种 PDF 处理功能,核心优势在于本地部署保障数据隐私。
项目介绍
Stirling-PDF 是一个强大的、可在本地托管的 Web 应用程序,专用于处理 PDF 文件。它采用 Docker 技术部署,提供了一系列丰富的 PDF 操作功能,以满足用户对 PDF 处理的各种需求。该项目遵循 MIT 许可证。
核心定位与解决的问题:
Stirling-PDF 的核心定位是提供一个安全、私密且功能齐全的 PDF 处理平台。通过本地托管,用户可以避免将敏感文档上传到第三方在线服务,从而保护数据隐私和安全。它解决的问题是为个人和企业提供一个在自有环境中管理和操作 PDF 文件的高效解决方案。
主要功能和特性:
Stirling-PDF 提供了 50 多种 PDF 操作功能:
- 页面操作:
- 查看和修改 PDF,支持自定义视图、排序和搜索。
- 交互式 GUI 进行合并、分割、旋转、移动页面。
- 合并/分割 PDF 文件。
- 重新组织页面顺序,删除页面。
- 多页布局,缩放页面内容,调整对比度,裁剪 PDF。
- 自动分割 PDF(根据扫描分隔符)。
- 提取或转换为单页,叠加 PDF。
- 按章节分割 PDF。
- 转换操作:
- PDF 与常见图片格式互转。
- 常见文件格式(如 Word, PowerPoint)与 PDF 互转(利用 LibreOffice)。
- HTML、XML、CSV、URL、Markdown 转换为 PDF。
- 安全与权限:
- 添加、移除、更改密码和权限。
- 添加水印。
- 签署/认证 PDF。
- 净化 PDF,自动修订文本。
- 其他操作:
- 添加/生成/写入签名。
- 按大小分割 PDF。
- 修复 PDF。
- 检测并移除空白页。
- 比较两个 PDF 的文本差异。
- 添加/提取/移除图片。
- 移除注释。
- 添加页码。
- 通过识别 PDF 头部文本自动重命名文件。
- 对 PDF 进行 OCR(使用 Tesseract OCR)。
- PDF/A 格式转换(使用 LibreOffice)。
- 编辑元数据。
- 扁平化 PDF。
- 获取并导出 PDF 所有信息为 JSON。
- 显示/检测嵌入的 JavaScript。
此外,Stirling-PDF 还具备以下通用功能:
- 支持文件并行处理和并行下载。
- 深色模式支持。
- 自定义下载选项。
- 自定义“管道”功能,可自动化执行多项操作。
- 提供 API,便于与外部脚本集成。
- 可选的用户登录与认证支持。
- 数据库备份与导入功能。
- 企业版提供 SSO 等增强功能。
技术栈/依赖:
项目主要使用 Java 语言开发。通过 Docker 部署,集成了 LibreOffice 进行文件格式转换,使用 qpdf 进行 PDF 压缩,使用 PDF.js 和 Joxit 处理 PDF 视图和页面编辑,以及 Tesseract OCR 进行光学字符识别。
安装与配置指南概述:
项目的完整安装和配置指南在其官方文档网站 docs.stirlingpdf.com
上提供,包括针对不同平台的安装步骤、配置选项、API 参考、安全设置以及企业版的功能说明。
基本使用方法概述:
Stirling-PDF 提供一个基于 Web 的图形用户界面。用户通过浏览器访问本地部署的应用,上传 PDF 文件,选择所需的操作功能(如合并、分割、转换等),配置相关选项后执行操作,最后下载处理后的文件。所有文件处理都在服务器内存中完成,或仅临时存储在文件系统中以便执行任务,处理完成后会自动删除,确保数据不留痕迹。
适用场景/目标用户:
该项目适用于任何需要频繁处理 PDF 文件,且对数据隐私和安全性要求较高的个人、团队或企业。典型场景包括:
- 个人用户进行日常 PDF 编辑和转换。
- 小型企业或团队在内部网络中共享 PDF 处理工具。
- 需要批量处理 PDF 或通过 API 集成 PDF 功能的开发者。
项目状态与许可证:
项目活跃开发中,提供了多个版本发布。Stirling-PDF 遵循宽松的 MIT 许可证。
独特的优势或创新点:
项目最大的优势在于本地托管的能力,保障了处理文件的隐私和安全。其全面的功能集、易用的 Web 界面以及对 Docker 的良好支持,使其成为一个强大且便捷的自托管 PDF 工具。通过“管道”和 API,用户还可以实现更复杂的自动化工作流程。
项目统计与信息
- 作者: Stirling-Tools
- 主要语言: Java
- Stars: 59305 ⭐
- Forks: 4972 🍴
- 本周期新增 Stars: 193 ⭐
要了解更多关于 Stirling-Tools / Stirling-PDF 的信息、查看完整的贡献者列表或参与项目,请访问其 GitHub 仓库。
OpenBB-finance / OpenBB
OpenBB Platform是一款开源金融平台,旨在整合多源数据,通过Python或命令行提供股票、期权、宏观等金融数据获取与分析工具。\n
项目介绍
OpenBB Platform 旨在为所有人提供投资研究工具,其核心定位是打造第一个开源的金融平台。该项目致力于整合数十个不同的数据供应商的数据源,并提供 Python 或命令行接口(CLI)供用户访问和使用。
OpenBB Platform 的主要功能和特性体现在其广泛的数据覆盖能力:
- 能够访问股票、期权、加密货币、外汇、宏观经济数据、固定收益等多种金融资产类别的数据。
- 提供一系列扩展功能,用户可以根据自身需求增强平台的使用体验。
- 除了编程接口,还提供了 CLI 工具,使用户可以直接通过命令行进行金融数据研究。
- 支持与 OpenBB Workspace 集成,通过企业级 UI 进行数据可视化并利用 AI 代理。
OpenBB Platform 使用 Python 语言开发。其平台架构支持通过安装不同的扩展和数据提供商来获取多样化的金融数据。它支持与多种AI代理集成,并且可以连接到OpenBB Workspace。
安装和配置方面,用户可以通过 pip 包管理器轻松安装 OpenBB Platform 或其 CLI 工具,命令分别为 pip install openbb
和 pip install openbb-cli
。对于更详细的安装步骤和要求,可以参考其官方文档。
基本使用方法方面,OpenBB Platform 主要通过 Python 包或 CLI 接口进行交互。例如,使用 Python 可以通过导入 openbb
模块,然后调用相应的方法来获取数据,如 from openbb import obb
和 output = obb.equity.price.historical("AAPL")
。
该项目面向对金融数据分析、量化研究、投资分析等感兴趣的技术人员和开发者,以及需要通过编程方式或命令行工具访问和分析金融数据的个人和机构。其开源性质也鼓励社区用户进行贡献和扩展。
OpenBB Platform 采用 AGPLv3 许可证发布,这意味着用户可以自由使用、修改和分发软件,但修改后的版本也必须在 AGPLv3 许可证下开源。项目的状态处于持续开发中,版本号不断更新。
项目的独特优势在于其作为开源金融平台的定位,旨在降低金融数据研究的门槛,并通过模块化和可扩展的架构,允许用户集成不同的数据源和自定义功能。它还强调社区驱动的开发模式。
OpenBB Workspace 则提供了更友好的图形界面和AI能力,可以进一步提升用户体验,Workspace与OpenBB Platform可以通过简单的API连接进行数据整合。
项目统计与信息
- 作者: OpenBB-finance
- 主要语言: Python
- Stars: 41516 ⭐
- Forks: 3717 🍴
- 本周期新增 Stars: 24 ⭐
要了解更多关于 OpenBB-finance / OpenBB 的信息、查看完整的贡献者列表或参与项目,请访问其 GitHub 仓库。
tursodatabase / limbo
Limbo是一个正在用Rust重写、旨在替代SQLite的现代进程内数据库引擎,其主要特性包括异步IO、兼容SQLite、多语言支持,目前仍在快速开发中。
项目介绍
Limbo 是一个正在进行中的项目,目标是构建 SQLite 的现代演进版本。它是一个进程内(in-process)的 OLTP 数据库引擎库,主要使用 Rust 语言编写。
项目的主要特性和目标包括:
- 异步 I/O 支持: 在 Linux 环境下利用
io_uring
提供异步 I/O 能力。 - SQLite 兼容性: 在 SQL 方言、文件格式和 C API 方面与 SQLite 保持一定程度的兼容性。
- 多语言绑定: 提供对 JavaScript/WebAssembly、Rust、Go、Python 和 Java 等多种编程语言的绑定支持,方便开发者在不同环境中使用。
- 跨平台支持: 可在 Linux、macOS 和 Windows 等操作系统上运行。
- 未来路线图: 计划增加集成向量搜索(用于嵌入和向量相似度)、
BEGIN CONCURRENT
支持(以提高写入吞吐量),以及改进的 schema 管理(包括更好的ALTER
支持和默认强制执行列类型)。
Limbo 的安装和使用相对便捷,提供了多种方式:
- 命令行工具: 可以通过
curl
脚本安装命令行工具,然后直接使用 SQL 命令操作数据库,支持内存数据库或持久化数据库文件。 - Rust 库: 作为 Rust 项目,可以直接通过
cargo add limbo
集成到 Rust 项目中,并使用其提供的 API 进行数据库操作。 - JavaScript/WebAssembly: 提供
limbo-wasm
包,可在 JavaScript 环境中使用。 - Python 库: 提供
pylimbo
包,方便 Python 开发者使用。 - Go 驱动: 提供 Go 语言驱动,兼容标准的
database/sql
接口。 - Java 库: 集成到 JDBC 中,可在 Java 环境中使用。
Limbo 与 Turso 的 libSQL 项目都旨在演进 SQLite,但 Limbo 是通过使用 Rust 重写来实现,而 libSQL 是基于对 SQLite 的 fork。Limbo 作为一个重写项目,目前仍在快速发展中,尚不适合生产环境,而 libSQL 项目已相对成熟。未来 Limbo 项目成熟后,计划直接更名为 "Turso"。
该项目采用 MIT 许可证,允许自由使用、分发和修改。欢迎社区贡献者參與项目建设。Limbo 的目标用户是需要一个现代、高性能、可嵌入且与现有 SQLite 生态有一定兼容性的数据库解决方案的开发者。
项目统计与信息
- 作者: tursodatabase
- 主要语言: Rust
- Stars: 10614 ⭐
- Forks: 398 🍴
- 本周期新增 Stars: 56 ⭐
要了解更多关于 tursodatabase / limbo 的信息、查看完整的贡献者列表或参与项目,请访问其 GitHub 仓库。
ed-donner / llm_engineering
这是一个关于 LLM 工程的 GitHub 资源仓库,配合一个八周课程,通过代码示例和实践项目帮助各阶段开发者系统学习和掌握 LLM 技术。
项目介绍
这是一个名为 "llm_engineering" 的 GitHub 仓库,旨在配合一个关于掌握 LLM 工程的为期八周的课程。这个仓库包含课程所需的资源、设置指南以及每周的项目代码。
项目核心是一个渐进式的学习旅程,通过实践项目帮助用户深入理解和掌握 LLM 相关的工程技术。
主要功能和特性:
- 提供分周组织的课程内容和代码示例,项目之间相互衔接,逐步提升学习深度。
- 包含针对 Windows、macOS 和 Linux 系统的详细环境设置指南,以保证学习环境的正常运行。
- 提供使用 Ollama 运行本地开源模型(如 Llama3.2)的快速启动指南,方便用户立即开始实践。
- 强调通过动手实践来学习,鼓励用户运行代码、检查结果、修改代码并完成挑战。
- 支持通过 Pull Request 贡献代码和解决方案。
- 在课程后期引入 Google Colab 等云端 GPU 环境,以应对更复杂的模型和计算需求。
- 提供免费使用 Hugging Face Pipelines API、Tokenizer 和模型的 Colab 示例。
- 特别提醒用户关注并控制 API 使用成本,建议优先使用价格更低的 Frontier 模型版本(如
gpt-4o-mini
和claude-3-haiku-20240307
),并提供免费的本地 Ollama 替代方案。 - 提供 API 使用情况监控面板的链接。
- 仓库内容最终会引导用户构建一个自主代理式 AI 解决方案。
技术栈/依赖:
- 项目主要使用 Python 编程语言,代码示例多以 Jupyter Notebook 形式提供 (
.ipynb
文件)。 - 支持多种 LLM 模型提供商,包括但不限于 OpenAI、Anthropic 以及本地运行的 Ollama (支持 Llama 系列模型)。
- 使用 Google Colab 运行需要 GPU 的项目。
- 可能涉及 Anaconda 或 Miniconda 进行环境管理,也提供非 Anaconda 用户的依赖文件 (
requirements.txt
)。
安装与配置指南概述:
- 用户需要根据操作系统(Windows、macOS、Linux)执行相应的设置步骤。
- 建议先安装 Ollama 并尝试运行 Llama3.2 模型进行快速验证。
- 完整的环境 setup 包括安装必要的软件和依赖,并需要根据教程进行配置。
基本使用方法概述:
- 按照周目录结构进入对应周的项目文件夹。
- 遵循 Notebook 中的指导,逐步运行代码单元。
- 根据需要配置 API 密钥或使用本地 Ollama 服务。
- 通过修改 Notebook 内容或完成挑战来自定义和扩展项目。
适用场景/目标用户:
- 适用于希望系统学习和掌握 LLM 工程技术的开发者、技术人员和学生。
- 目标用户是那些希望通过动手实践方式深入理解大型语言模型应用、模型部署、提示工程、代理构建等知识的人。
- 也适合有一定编程基础,希望进入或深化在 AI 领域的技能的人。
项目状态与许可证:
- 项目处于持续更新和完善状态,包含了多周的课程内容。
- 仓库采用 MIT 许可证。
这是一个面向实践的 LLM 工程学习资源仓库,通过结构化的课程内容和丰富的代码示例,帮助学习者逐步构建 LLM 应用的实战能力。
项目统计与信息
- 作者: ed-donner
- 主要语言: Jupyter Notebook
- Stars: 1643 ⭐
- Forks: 1733 🍴
- 本周期新增 Stars: 8 ⭐
要了解更多关于 ed-donner / llm_engineering 的信息、查看完整的贡献者列表或参与项目,请访问其 GitHub 仓库。
arendst / Tasmota
Tasmota 是一款开源固件,专为基于 ESP8266 和 ESP32 的智能家居设备设计,提供本地控制、高可定制性和易于使用的配置界面,帮助用户摆脱云服务依赖。
项目介绍
Tasmota 是一个备受推崇的开源固件项目,专为基于 ESP8266 和 ESP32 芯片的智能家居设备设计。其核心目标是提供一个易于配置、功能强大且完全本地控制的替代固件,从而摆脱原厂云服务的依赖,增强用户隐私和设备的自主性。
Tasmota 提供了一个用户友好的 Web UI 界面,使得设备的配置和管理变得简单直观。它支持 OTA(Over-The-Air)空中升级,方便用户远程更新固件。通过内置的定时器和规则引擎,用户可以实现设备的自动化控制,无需外部控制器。
该固件具备出色的可扩展性,支持广泛的传感器、执行器和模块,可以通过配置灵活适应各种智能设备,如智能插座、传感器、开关、照明等。在通信方面,Tasmota 支持多种协议,包括 MQTT、HTTP、Serial 和 KNX,其中 MQTT 是其主要和推荐的通信方式,便于与各种智能家居平台(如 Home Assistant, openHAB, Domoticz 等)集成,实现完全本地化的设备控制。
Tasmota 主要使用 C 和 C++ 语言开发,并利用 PlatformIO 进行构建管理,同时也包含少量 Berry 和 Python 代码。项目提供了详细的安装、配置和使用文档,以及针对不同设备类型的模板库,极大地简化了用户上手难度和设备适配过程。对于希望自定义功能的用户,项目支持通过修改 user_config_override.h
文件进行编译时配置。
项目的安装通常可以通过 Tasmota WebInstaller 或下载预编译的固件二进制文件进行。对于从旧版本 Tasmota 升级的用户,项目提供了清晰的迁移路径和注意事项,特别是涉及主要版本更新时配置存储或 GPIO 功能表示的变化。
Tasmota 适用于希望摆脱云服务、追求本地控制、需要高度可定制性和灵活性的智能家居爱好者、开发者和技术人员。它通过提供一个稳定、强大且开放的平台,赋能用户自由掌控他们的 ESP8266 和 ESP32 设备。
该项目遵循 GPL-3.0 许可协议,是一个活跃的社区驱动项目,拥有众多贡献者提供了广泛的支持、代码改进、错误修复和文档完善。项目鼓励用户通过贡献代码、测试、报告问题或捐赠来支持发展。
项目统计与信息
- 作者: arendst
- 主要语言: C
- Stars: 23177 ⭐
- Forks: 4906 🍴
- 本周期新增 Stars: 5 ⭐
要了解更多关于 arendst / Tasmota 的信息、查看完整的贡献者列表或参与项目,请访问其 GitHub 仓库。
LizardByte / Sunshine
Sunshine是一个开源游戏串流服务端软件,让你可以把电脑游戏串流到各种设备上的Moonlight客户端流畅游玩。
项目介绍
Sunshine 是一个针对 Moonlight 客户端的自托管游戏串流主机软件。它旨在提供低延迟的云游戏服务器功能,允许用户将游戏或桌面从一台强大的计算机串流到各种设备上的 Moonlight 客户端。
项目主要特性包括:
- 自托管游戏串流: 用户可以在自己的计算机上安装 Sunshine,将其设置为游戏串流服务器。
- 低延迟: 项目专注于优化串流过程以实现低延迟,提供更好的游戏体验。
- 广泛的 GPU 支持: 支持 AMD (VCE 1.0+), Intel (Linux: VAAPI 兼容, Windows: Skylake 或更新), 和 Nvidia (NVENC 支持显卡) 的硬件编码,同时也支持软件编码。
- 与 Moonlight 客户端配合使用: 作为 Moonlight 的配套服务器端,Sunshine 允许用户通过多种设备上的 Moonlight 应用程序连接并接收串流。
- Web UI 配置: 提供一个基于 Web 的用户界面,方便进行配置和客户端配对,无论是从本地服务器还是移动设备。
- 跨平台支持: 可安装在多种操作系统上,包括 Windows (10+)、macOS (13+) 和 Linux ( Debian 12+, Fedora 40+, Ubuntu 22.04+)。
- 网络建议: 推荐使用 5GHz 802.11ac 或更快的网络连接,尤其是在追求 4K 或 HDR 串流时建议使用 CAT5e 网线。
- 活跃的社区和贡献者: 项目拥有大量贡献者参与开发和本地化工作。
关于系统要求:
- 最低配置: 需要特定代次的 AMD, Intel 或 Nvidia GPU 支持对应的硬件编码技术,以及至少 Ryzen 3/Core i3 或更高性能的 CPU 和 4GB 内存。
- 4k 串流建议: 要求更高的 GPU (如 AMD VCE 3.1+, Intel HD Graphics 510+, Nvidia GTX 1080+) 和 CPU (Ryzen 5/Core i5+),并建议使用有线网络。
- HDR 串流建议: 需要支持 HDR 的 GPU (如 AMD VCE 3.4+, Intel HD Graphics 730+, Nvidia Pascal 或更高) 和更强的 CPU/网络。
Sunshine 利用 Moonlight Client 和自身作为 Host 端,为用户提供了一个强大且灵活的游戏串流解决方案,特别适合那些希望将游戏从高性能 PC 串流到其他设备进行游玩的技术用户和玩家。项目基于 GPL-3.0 许可证发布。文档托管在 Read the Docs 上,提供了稳定版和 Beta 版的详细信息。
项目统计与信息
- 作者: LizardByte
- 主要语言: C++
- Stars: 25434 ⭐
- Forks: 1218 🍴
- 本周期新增 Stars: 39 ⭐
要了解更多关于 LizardByte / Sunshine 的信息、查看完整的贡献者列表或参与项目,请访问其 GitHub 仓库。