离线部署之两种构建Ragflow镜像的方式,dify同理
在实际项目交付过程中,经常遇到要离线部署的问题,生产服务器无法连接外网,这时就需要先构建好ragflow镜像,然后再拷到U盘或刻盘,下面介绍两种构建ragflow镜像的方式。
性能测试(网络情况好的情况下,国内的网络达不到这个水平)
工具 | 安装100个包耗时 | 内存占用 | 跨平台支持 |
uv | 38秒 | 120MB | |
pip | 2分15秒 | 280MB | |
poetry | 3分10秒 | 350MB |
一、使用uv方式(官方推荐)
uv是一个用Rust写的Python包安装器和解析器,由Astral开发,旨在替代pip和pip-tools,速度更快。用户可能在项目中使用uv来加速依赖安装,但可能由于网络问题或安装uv本身的问题导致卡住。
#下载ragflow
cd /data
git clone https://github.com/infiniflow/ragflow.git
cd ragflow/
#安装uv
# 国内镜像加速安装 #这一步比较慢,要有耐心
pipx install uv -i https://mirrors.bfsu.edu.cn/pypi/web/simple/
#在执行run前记得给足够的权限,提示Permission denied
sudo chmod 777 . #或 sudo chmod 777 /data/ragflow/
uv run download_deps.py
docker build -f Dockerfile.deps -t infiniflow/ragflow_deps .
docker build --build-arg LIGHTEN=1 -f Dockerfile -t infiniflow/ragflow:nightly-slim .
常见问题:
1、权限不足Permission denied
sudo chmod 777 . #或 sudo chmod 777 /data/ragflow/
2、下载超时,很多镜像都是国外的,我们很多人都在这个环境中浪费了很多时间,没办法只能想办法一个个下载下来再安装或者代理,本来很快的工具,到这里也要跪。
二、使用pip安装依赖
1、创建虚拟环境
#安装venv
sudo apt install python3.12-venv
# 创建虚拟环境
sudo python3 -m venv .venv
#激活虚拟环境
source .venv/bin/activate
#先给足权限,不然后面会报错
sudo chmod 777 .
#安装所需要的依赖,可能会遇到很多版本问题,比如我是python3.12,要提示修改一些依赖版本
#指定国内源超快的
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
#如果有找不到的包,可以换个镜像试试
pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/
#再找不到尝试下载whl文件,然后单独安装即可。
在3.12环境下需要升级的依赖
Aspose.Slides==24.2.0修改为25.1.0
Pillow=10.3.0修改为11.1.0
torch=2.3.0修改为2.3.1
2、执行自带的下载脚本
# 直接使用Python运行
python download_deps.py
3、构建docker镜像
# 构建deps镜像
docker build -f Dockerfile.deps -t infiniflow/ragflow_deps .
# 构建最终镜像
docker build --build-arg LIGHTEN=1 -f Dockerfile -t infiniflow/ragflow:nightly-slim .
4、常见问题:
权限不足:
ERROR: Could not install packages due to an OSError: [Errno 13] Permission denied: '/data/ragflow_inner/ragflow/ragflow/.venv/lib/python3.12/site-packages/xpinyin'
Check the permissions.
解决方式:
# 进入项目根目录
cd /data/ragflow_inner/ragflow/ragflow
# 递归修改目录所有权
sudo chown -R $USER:$USER .venv/
# 验证权限
ls -la .venv/lib/python3.12/site-packages/
通过以上方案,可实现在完全离线环境下完成所有依赖资源的部署。建议在部署前进行全量测试,确保各组件版本严格匹配。若需更新资源,请在外网环境重复第一步操作后同步更新内网资源目录。
创作不易 关注 收藏 点赞