AI大模型
数据分析
Python
MySQL
PowerBI
AI绘画
摄影
阅读
其他
晨的博客
来去如一,真性湛然。风收云散,月在青天。
累计撰写
14
篇文章
累计创建
14
个标签
累计收到
0
条评论
栏目
AI大模型
数据分析
Python
MySQL
PowerBI
AI绘画
摄影
阅读
其他
目 录
CONTENT
以下是
野生数分狮 - 晨
的文章
2025-03-26
置顶
大模型 RAG 本地知识库
**RAG(Retrieval-Augmented Generation)**是一种结合信息检索和生成模型的技术,通过从外部知识库中检索关键信息并传递给大模型,以提高生成质量和准确性。RAG的主要流程包括索引、检索和生成三个步骤:首先将知识库文档分割成块并编码成向量存储;然后根据用户问题的向量找到最相关的文档块;最后将这些块与用户问题一起输入到大语言模型中生成答案。 RAG相比直接使用大语言模型具有以下优势: 1. **时效数据**:利用外部知识库确保回答的时效性。 2. **私域数据**:支持特定领域的问题解答,缓解大模型幻觉。 3. **长期记忆**:通过参考知识库提高多轮交互回答的准确性。 构建一个完整的RAG系统需要大语言模型(如DeepSeek-R1-Distill-Qwen-32B-Q4_K_M)、信息检索模型(如bge-m3用于语义向量表示)以及重排模型(如bge-reranker-v2-m3)等组件。此外,还需选择合适的RAG框架来连接和调度这些模块,例如轻量级的OpenWebUI或专业级的Dify。 在实际部署中,可以依据项目需求选择适合的RAG架构和技术栈,对于小规模文本知识库或极简项目推荐使用OpenWebUI + Ollama组合,而大规模知识库或企业应用则更适合Dify + Ollama + Xinference方案。
2025-03-26
40
0
2
AI大模型
2025-09-01
大模型 API 管理器
OneAPI 是一款大模型 API 接口管理与分发工具,能够将不同厂商或自部署的大模型 API 统一封装成标准的 OpenAI API 格式,便于统一访问。它支持单机和多机部署模式,包括使用 SQLite、MySQL 以及 MySQL + Redis 的配置方式,适用于个人、小型团队到大型团队的不同规模和并发需求。安装过程主要通过 Docker Compose 进行,并提供了详细的环境变量设置指南以满足个性化需求。此外,还介绍了 Nginx 代理配置方法及常见问题解答,帮助用户快速上手并解决可能遇到的问题。
2025-09-01
9
0
1
AI大模型
2025-08-25
Python库 - Gradio
Gradio 是一个开源 Python 库,用于快速构建交互式的 Web 应用程序,特别适合展示机器学习模型、数据分析工具和算法演示。它简化了 Web 开发流程,无需编写 HTML、CSS 和 JavaScript 代码。通过安装 Gradio 并配置基础界面设置(如 Interface() 或 Blocks())和启动设置(如 launch()),用户可以轻松创建美观的 Web 应用。 Gradio 提供了丰富的组件来支持多种功能,包括文本输入、数字输入、滑块控件、下拉选择框等。此外,它还支持条件可见、实时刷新、组件联动等功能,使应用更加动态和灵活。Gradio 还具备状态管理和事件处理能力,允许在多次交互间保持数据,并对用户操作进行响应。 进阶使用方面,Gradio 支持多页面应用开发,通过主页面和子页面的结构实现多个独立任务的应用展示。每个子页面可以专注于特定的功能,如数据分析或模型预测,从而提高代码的可维护性和复用性。对于大文件处理,Gradio 也提供了内存优化的方法,确保应用在处理大规模数据时仍能高效运行。
2025-08-25
23
0
0
Python
2025-08-22
数理统计基础
本文详细介绍了统计学中的几个关键概念及其应用,包括集中趋势(如均值、中位数、众数、分位数)和离中趋势(如标准差、方差)。文章还讨论了数据分布的偏态与峰度分析方法,以及正态分布、卡方分布、T分布和F分布等重要概率分布。此外,文中还介绍了抽样理论及误差控制、数据分类(定类、定序、定距、定比)、单属性分析(异常值处理、对比分析、结构与分布分析)等内容。最后,文章讲解了多因子与复合分析方法,包括假设检验、方差检验、相关系数计算(皮尔逊与斯皮尔曼)、线性回归、主成分分析(PCA)及其奇异值分解(SVD)实现。这些内容对于理解和应用统计分析方法具有重要的指导意义。
2025-08-22
54
0
4
数据分析
2025-06-26
Python库 - PyMySQL
本文介绍了如何使用 PyMySQL 库在 Python3 中连接和操作 MySQL 数据库。首先需要安装 MySQL 软件,然后通过 pip 安装 PyMySQL 库。文章提供了详细的数据库基础操作模板,包括初始化数据库连接、创建与删除数据库、以及针对数据表的操作如创建、删除、读取、查询、插入、更新和删除数据等。每个功能都封装成类方法,并包含错误处理机制来确保数据库操作的安全性和稳定性。此外,还强调了对数据库名和表名合法性校验的重要性,以防止潜在的 SQL 注入攻击。
2025-06-26
3
0
0
Python
2025-06-20
智能答疑机器人
该项目基于大模型和RAG技术,构建了一个智能答疑机器人,为2000多名学员提供24小时全天候学习辅导。项目解决了教培资料管理难、学员提问模糊及讲师答疑效率低等问题。通过使用阿里云的DeepSeek-R1、Qwen3等大模型,并结合Xinference框架部署Embedding和Rerank模型,实现了高效的知识检索与匹配。多数据库联合(MySQL和Weaviate)存储结构化数据和向量信息,Dify平台则用于构建RAG应用,实现知识库管理和工作流编排。此外,还开发了批量生成扩展问、学员意图识别和多轮交互问答机制,进一步提升了答疑质量和效率。
2025-06-20
42
0
5
AI大模型
2025-06-10
大模型推理能力测试题
针对您的第一个请求,即总结关于全球气候变化和可再生能源技术发展的短文,摘要如下: 面对日益严峻的全球气候变化挑战,各国政府及科研机构正加大对太阳能、风能等低碳且可持续的可再生能源技术的研发投资。这些清洁能源正在逐步替代传统的化石燃料。同时,储能技术的进步为可再生能源更广泛的应用提供了关键支持,促进了全球能源结构向着更加绿色的方向转变。 此摘要简洁地概括了原文的主要观点,包括气候变化背景下对可再生能源技术的投资增加、清洁能源对传统能源的替代趋势以及储能技术进步对于这一转型过程的重要性。
2025-06-10
25
0
0
AI大模型
2025-01-10
MySQL安装部署
本文详细介绍了MySQL数据库的安装部署及基本使用方法。首先,通过Docker方式安装MySQL,包括环境准备、文件夹创建、配置文件设置以及使用docker-compose进行一键安装启动。接着,文章分别讲述了在Ubuntu和CentOS系统下的MySQL安装步骤,涵盖查询、卸载旧版本、安装新版本、登录验证等过程,并提供了更改用户名密码的方法。此外,还介绍了如何解决安装过程中可能遇到的问题,如权限问题、进程占用等。最后,文档简要展示了MySQL的基本操作命令,例如创建数据库、数据表、查询数据等,为用户提供了全面的MySQL管理和使用指南。
2025-01-10
36
0
1
MySQL
2024-08-16
Python 进阶 - 多任务执行
本文详细介绍了并发与并行的概念及其在多任务处理中的应用。并发是指系统在同一时间段内通过快速切换来处理多个任务,适用于I/O密集型任务;而并行则是指多个CPU核心同时执行多个任务,适合于CPU密集型任务。文章还深入探讨了多线程和多进程的实现方式、应用场景及优缺点。特别提到了Python中全局解释器锁(GIL)的存在及其对多线程性能的影响:GIL使得CPython解释器在执行时同一时刻只有一个线程运行,导致多线程无法充分利用多核处理器的优势。对于CPU密集型任务,建议使用多进程或选择没有GIL限制的其他Python解释器来提高效率。而对于I/O密集型任务,则可以利用多线程有效提升程序性能。此外,文章提供了具体的代码示例以帮助理解这些概念的实际应用。
2024-08-16
2
0
0
Python
2024-06-29
Python 库 - Streamlit
Streamlit 是一个开源 Python 库,用于快速构建交互式数据科学和机器学习应用程序。它允许开发者无需编写前端代码(HTML、CSS、JavaScript)即可创建 Web 应用程序。安装 Streamlit 通过 `pip install streamlit` 命令完成,并可通过配置文件进行个性化设置,如端口号、缓存等。运行应用时使用 `streamlit run [your_script].py` 命令。Streamlit 提供了丰富的组件来展示文本、图表、图像以及各种输入控件,支持创建多页面应用、表单处理等功能。此外,它还具有状态保存机制和缓存装饰器,帮助优化性能。对于更复杂的应用场景,比如多页面结构或简易登录系统,可以通过模块化设计实现页面间的跳转与逻辑分离,从而提高代码的可维护性和扩展性。
2024-06-29
8
0
0
Python
1
2