找到服务配置文件
vim /etc/systemd/system/ollama.service
2025/8/7...小于 1 分钟
vim /etc/systemd/system/ollama.service
在服务器运维中,我们可能会遇到一个特殊的需求:服务器上有一个服务(如Nginx、Tomcat)监听在本地回环地址(127.0.0.1
)的某个端口上(如 8080
),但我们希望通过服务器的公网或内网IP的另一个端口(如 80
)来访问这个服务。
典型场景:
192.168.30.177
(对外)127.0.0.1:8080
http://192.168.30.177:80
时,请求能被正确转发到 127.0.0.1:8080
上的服务。构建大模型需要考虑的因素归一化方法、位置编码、激活函数、注意力计算
层数L、注意力头数N、特征维度N
不同特征在空间中的尺度不同,对损失优化的影响不一致
特征尺度差异会导致损失函数各方向的梯度下降速度不同。尺度大的特征梯度更新剧烈,迫使模型花费更多迭代次数调整其他特征权重,降低优化效率。
提升训练稳定性,加速模型收敛
归一化使所有特征处于相近的数值范围(如[0,1]或[-1,1])。这使优化路径更平滑,梯度更新方向更稳定,减少震荡风险,从而加快模型收敛速度。
通过脚本批量修改Git提交历史中的作者姓名和邮箱:
bash <(curl -s https://www.geekery.cn/sh/LinuxCTS/tools/git_change_author.sh)
在PowerShell中直接运行以下命令启动Git Bash:
& 'C:/Program Files/Git/bin/sh.exe' --login
使用以下命令可以一键安装OpenVPN:
curl -sSL https://www.geekery.cn/sh/LinuxCTS/tools/openvpn-install.sh | bash
在搜索场景中,人们的目光往往会更加关注左上角的三角区域(即第一条搜索结果的位置)
注意力机制,可以视为一致基于相似度的查表
核心模块: 注意力
MinerU是一个将PDF转换为机器可读格式的工具(例如,markdown,JSON),允许轻松提取为任何格式。
https://github.com/opendatalab/MinerU/blob/master/README.md
年份 | 事件 |
---|---|
2017年 | 谷歌提出Transformer |
2018年 | OpenAI提出GPT(1亿+参数) |
2019年 | GPT - 2(15亿参数) |
2020年 | GPT - 3(1750亿参数) |
2021年 | CodeX(基于GPT - 3,代码预训练) |
2021年 | WebGPT(搜索能力) |
2022年2月 | InstructGPT(人类对齐) |
2022年11月 | ChatGPT(对话能力) |
2023年3月 | GPT - 4(推理能力、多模态能力) |
2024年9月 | o1(深度思考能力提升) |
2025年1月 | o3(深度思考能力进一步增强) |