前言

我们,迎着黑暗前进,背后是点亮的光明。

本系列项目为配合启点科研的基本训练。

FromZero Training Project 102


Project00:报告

  1. 训练邮箱:fromzerox@126.com

  2. 每次发邮件主题和内容不能空白

  3. 报告用Markdown完成,xxx.md, 并转换成pdf格式

  4. 可以的撰写工具为: Typora 等

  5. 报告格式统一:汉字字体(宋体),英文字体(Time New Romes)

  6. 在Email附件中,上交.md和.pdf

  7. 在邮件系统中建立自己的签名

2025/07/26


Project01: windows 程序

  1. 目标:

    1. 打开一个图像文件(bmp,jpg,dcm)

    2. 判别文件格式, 调用不同的库打开

    3. 显示原始图片

    4. 处理图片(灰度化,反影,调整等)

    5. 显示处理图片

    6. 关闭图片

    7. 推出软件

  2. 操作系统

    1. Windows

  3. 编程语言

    1. Python

  4. 建议库/包

    1. kivy

    2. opencv

    3. 其它

  5. 上交部署

    1. 用批处理文件 .bat, 编写启动引导

    2. 编写库需求 requirements.txt

    3. 全部文件压缩打包 .zip

*2025/07/28


Project02: 本地web 程序

  1. 目标

    1. 实现一个基于Deepseek的聊天机器人

    2. www.deepseek.com上申请API 账号 DeepSeek 开放平台

    3. 获得 API key (DS 内部key: sk-3eea03d350544b899d91369d67d8e6f8)

    4. 用chainlit库 实现和deepseek连接

    5. 开启本地LLM web服务

    6. 在web界面可以和Deepseek 进行文本对话

    7. hint: 如果 deepseek 不能申请开发接口,可以从 硅基流动 https://cloud.siliconflow.cn/ 获得

  2. 操作系统

    1. windows

    2. we browser (MS edge, google chrome等)

  3. 编程工具

    1. python

    2. visual studio code

    3. power shell/conemu

    4. hint: 为避免和anaconda的冲突,直接安装python安装在独立目录,并在系统环境变量设置python路径并置顶

  4. 库/包

    1. chainlit

    2. openai

    3. 其它

  5. 上交部署

    1. 用批处理文件 .bat, 编写启动引导

    2. 编写库需求 requirements.txt

    3. 全部文件压缩打包 .zip

2025/07/28


Project03: web AI 和 数据表达

  1. 目标

    1. 对新生代python AI 和 大数据 接口库进行学习

    2. 实现streamlit 或Taipy 或 gradio

    3. 与deepseek 连接

    4. 数据建立(导入,生成)

    5. 数据计算

    6. 数据显示

  2. 操作系统

    1. windows

    2. we browser (MS edge, google chrome等)

  3. 编程工具

    1. python

    2. visual studio code

    3. power shell/conemu

    4. hint: 为避免和anaconda的冲突,直接安装python安装在独立目录,并在系统环境变量设置python路径并置顶

  4. 库/包

    1. streamlit

    2. taipy

    3. gradio

    4. requests

    5. json

    6. 其它

  5. 上交部署

    1. 用批处理文件 .bat, 编写启动引导

    2. 编写库需求 requirements.txt

    3. 全部文件压缩打包 .zip


Project04:机器学习

  1. 概念学习

    1. 人工智能是什么?

    2. 机器学习(ML)是什么?

    3. 机器学习和统计的关系?

    4. 深度学习(DL)和机器学习(ML)的关系?

  2. python

    1. 基于Python 进行机器学习的库/包

    2. Numpy, Scipy, Pandas, Opencv, Matplotlib, seaborn

    3. Scikit-learn, Pytorch

  3. 用ML进行学习的基本过程

    1. 数据获取(公开、思雨、生成)

    2. 数据处理(清洗、归类、缺失)

    3. 数据分析(特征工程)

    4. 模型构建(模型选择)

    5. 训练模型 (参数优化)

    6. 性能评估(评估指标)

  4. ML的模型应用:线性回归

    1. 线性回归基本原理

    2. 线性回归机器学习的过程

    3. 实践

      1. 从公开数据源,获得随单变量变化过程的一维数据,

      2. 应用线性回归模型,训练模型参数,建立预测

      3. 用分析和展示工具,表达预测结果和训练性能。


Project05:AutoGen

  1. 概念学习

    1. 智能体 Agent

    2. 大语言模型

    3. 模型微调

  2. 库学习 Autogen

    1. Autogen的主要功能

    2. Autogen的结构

    3. Autogen实现多智能体的架构

  3. 项目

    1. 用Chainlit, Deepseek 和 Autogens实现2个本地Web的多智能体小系统

      1. 实现单智能体智能医院客服

      2. 实现多智能体智能医院到诊

  4. 报告

    1. 练习用Typora 写 Markdown 脚本的项目报告

    2. 上交 md 和 pdf


Project06:Deeplearning

  1. 目标

    1. 尝试用machine learning 和 Deeplearning 实现手写字母或数字识别

    2. 掌握图像识别的方法和过程

  2. 学习

    1. 机器学习和深度学习进行手写字母或数字识别的过程

    2. Pytorch库

    3. Minst数据集 (可从Hugging Face 等处获得)

    4. CNN

    5. 神经元的基本结构

    6. 多神经元网络结构

    7. 卷积神经网络基本结构

  3. 项目

    1. 用传统的机器学习方法,选择模型(如KNN) 进行训练,模式识别,分类和验证

    2. 用深度学习完成手写单字母或数字识别

      1. 用 Pytorch程序库

      2. 自主选择深度神经网络如CNN

      3. 考察有效建模训练集数据量

  4. 报告

    1. 用 Markdown 书写报告

    2. 上交 md 和 pdf


Project07:RAG


Project08:Graph RAG


Project09:文本报告分析


Project09:心声数据分析


The END.

启点科研 fzero.sinogourd.com