Skip to content

Tech Learning

Home
Home
- Networking Basics
  Networking Basics
  - 無類別區隔路由 CIDR
  - Dnsmasq 本地 DNS 解析器
- SSL 憑證
  SSL 憑證
- Identity
  Identity
  - Dex
    
    Dex
- YAML
  YAML
  - YAML 入門教程
  - Learn YAML
- CI/CD
  CI/CD
  - GitOps 的概念
Python
Python
- Alembic
  Alembic
NanoBanana
NanoBanana
- 教學
  教學
  - Nano Banana Pro 使用黃金法則
LangChain
LangChain
- Middleware
  Middleware
  - Overview
  - Built-in middleware
    Built-in middleware
    
    Built-in
    
    補充
    補充
    
    Todo
    Todo
    
    自動管理任務清單
    
    如何使用 TODO 來規劃任務
LangGraph
LangGraph
- Get started
  Get started
- Capabilities
  Capabilities
  - Persistence
LangSmith
LangSmith
- Deployment
  Deployment
  - Deployment guides
    Deployment guides
    
    Standalone servers
    Standalone servers
    
    佈署自託管 Agent Servers
- Reference
  Reference
  - LangSmith Deployment
    LangSmith Deployment
    
    LangGraph CLI
Deep Agents
Deep Agents
- Overview
- Get started
  Get started
  - Quickstart
  - Customization
- Core capabilities
  Core capabilities
- Command line interface
  Command line interface
  - Use the CLI
AI Agent
AI Agent
- Dev 程式語言
  Dev 程式語言
  - Python
    Python
    
    uv
    uv
    
    如何使用 uv
- OpenAI
  OpenAI
  - 核心概念
    核心概念
    
    Structured Outputs
  - Jina AI
    
    Jina AI
- Tools
  Tools
  - WebSearch
    WebSearch
    
    SearXng
    
    SearXng
    
    安裝
    
    API介詔
- LiveKit
  LiveKit
  - 核心概述
    核心概述
    
    快速上手
    快速上手
    
    LiveKit 簡介
    
    Rooms,participants & tracks
    
    Authentication
    
    CLI
    CLI
    
    安裝 CLI
    
    Bootstrapping 應用
    
    LiveKit SDKs
    LiveKit SDKs
    
    連接至 LiveKit
    
    Realtime media
    Realtime media
    
    Overview
    
    Camera & microphone
    
    Screen sharing
    
    Subscribing to tracks
    
    Noise & echo cancellation
    
    End-to-end encryption
    
    Codecs & more
    
    Realtime text & data
    Realtime text & data
    
    Overview
    
    Sending text
    
    Sending files & bytes
    
    Remote method calls
    
    Data packets
    
    State synchronization
    State synchronization
    
    Overview
    
    Participant attributes
    
    Room metadata
    
    Handling events
    
    Server APIs
    Server APIs
    
    Token generation
    
    Room management
    
    Participant management
    
    Webhooks
    
    Self-Hosting
    Self-Hosting
    
    Running locally
  - AI Agents
    
    AI Agents
    
    快速上手
    快速上手
    
    Voice AI quickstart
    
    Web and mobile frontends
    
    Agents playground
    
    構建語音助理
    構建語音助理
    
    Overview
    
    Workflows
    
    Agent speech & audio
    
    Vision
    
    Tool 定義與使用
    
    Pipeline nodes & hooks
    
    Text & transcriptions
    
    對話輪次偵測 & 中斷
    對話輪次偵測 & 中斷
    
    Overview
    
    Turn detector plugin
    
    Silero VAD plugin
    
    外部數據 & RAG
    
    指標捕獲
    
    事件與錯誤處理
    
    Worker 生命周期
    Worker 生命周期
    
    Overview
    
    Agent dispatch
    
    Job lifecycle
    
    Worker options
    
    佈署與運維
    佈署與運維
    
    Deploying to production
    
    Session recording & transcripts
Kubernetes
Kubernetes
- Getting started
  Getting started
  - 學習環境
    學習環境
    
    K3D
    K3D
    
    使用 K3D 設置 Kubernetes 集群
    
    K3D + Nginx Ingress 控制器
    
    Minikube
    Minikube
    
    如何在 Ubuntu 20.04 上安裝 Minikube
    
    Nvidia
    
    Nvidia
    
    Nvidia Container Toolkit
    
    Nvidia Container Toolkit
  - 最佳實踐
    最佳實踐
    
    PKI 證書和要求
- Concepts
  Concepts
  - 概述
    概述
    
    K8S 介詔
  - Kubernetes 架構
    Kubernetes 架構
    
    K8S 架構解析
    
    Container Runtime 接口(CRI)
    
    Container Runtime 接口(CRI)
    
    Containerd
    Containerd
    
    如何在 Ubuntu 22.04 上安裝 Containerd
  - Serivce, 負載均衡與網路
    Serivce, 負載均衡與網路
    
    K8S 網絡通信介紹
    
    應用程序向外部公開服務手法
    
    在 K3D 設定 Metallb
  - 存儲
    
    存儲
    
    在 Pod 和本機進行文件複製
  - 配置
    配置
    
    配置最佳實踐
    
    ConfigMap
    
    Secret
  - 集群管理
    集群管理
    
    日誌架構
    
    日誌完整指南
    
    日誌記錄實用指南
- Tasks
  Tasks
  - 管理 Kubernetes 對象
    管理 Kubernetes 對象
    
    使用 Kustomize 對 Kubernetes 對象進行聲明式管理
  - 訪問集群中的應用程序
    訪問集群中的應用程序
    
    部署和訪問 Kubernetes 儀表板
  - 監控、日誌和除錯
    
    監控、日誌和除錯
    
    應用程序故障排查
    
    應用程序故障排查
    
    集群故障排查
    
    集群故障排查
    
    簡介
  - TLS
    TLS
    
    手動生成證書
    
    管理集群中的 TLS 認證
    
    手動輪換 CA 證書
    
    其它參考
    其它參考
    
    Openssl 證書生成命令大全
    
    帶 IP 地址的自簽 SSL/TLS
    
    使用 mkcert 製作本機憑證
- Autoscale
  Autoscale
  - Kubernetes 自動縮放
  - Kubernetes 垂直自動縮放
- Tutorials
  Tutorials
  - 你好, K3D
  - 學習 Kubernetes 基礎知識
    
    學習 Kubernetes 基礎知識
    
    創建集群
    
    部署應用
    
    了解應用
    
    公開曝露應用
    
    縮放你的應用
    
    更新你的應用
  - 配置
    配置
    
    ConfigMap 與 Secret
  - 存儲
    存儲
    
    存儲管理 volume、PV/PVC
- Reference
  Reference
  - API 概述
    API 概述
    
    使用 K8S API
    
    K8S API 基礎
    
    用 HTTP 客戶端調用 K8S API
  - API 存取權限控制
    API 存取權限控制
    
    Kubernetes RBAC 介詔
    
    使用 RBAC 設置服務帳戶權限
    
    ServiceAccounts、JWT-tokens、身份驗證和 RBAC 授權
    
    在集群內部調用 Kubernetes API
- Observability
  Observability
  - Day2 運營
    Day2 運營
    
    Day2 的定義
    
    Day2 的挑戰
    
    Kubernetes Day2 運營
  - 概念
    概念
    
    Kubernetes 可觀察性
    
    監控 Kubernetes 的挑戰
  - Observability 學習指南
    Observability 學習指南
    
    Part 1. 學習指南說明
    
    Part 2. Prometheus, Alertmanager & Grafana 架構介詔
    
    Part 3. Prometheus & Alertmanager 基本概念
    
    Part 4. PromQL 介詔
    
    Part 5. Alerts 最佳實踐
    
    Part 6. Kubernetes 中安裝設定 Prometheus 指南
  - 日誌 Logging
    日誌 Logging
    
    Loki
    Loki
    
    使用 Loki 做為 Kubernetes 的日誌聚合亓件
    
    使用 Logging Operator 將 Nginx 日誌存儲在 Grafana Loki
    
    Loki 查詢語言 LogQL
    
    Logging Operator
    Logging Operator
    
    Logging Operator 日誌管理方案
    
    Logging Operator 的擴展
    
    Rancher 2.6 全新 Logging 快速入門
    
    Rancher 2.6 全新 Logging 快速入門(2)
  - 指標 Metrics
    指標 Metrics
    
    Prometheus Operator
    Prometheus Operator
    
    Prometheus-operator 介绍和配置解析
  - 追踪 Traces
    追踪 Traces
    
    開發語言
    開發語言
    
    Java
    Java
    
    SpringBoot
- Tools
  Tools
  - Packaging 管理
    Packaging 管理
    
    Helm
    Helm
    
    Helm 入門教學
    
    K8S 應用部署之 Helm 初探
  - Config 管理
    Config 管理
    
    Kustomize
    Kustomize
    
    Helm 入門教學
CloudNative
CloudNative
- Coding
  Coding
  - 12 Factors
    12 Factors
    
    12 要素應用實戰
  - Observability
    Observability
    
    指標 Metrics
    指標 Metrics
    
    可觀測性(metrics)實戰
    
    日誌 Logs
    日誌 Logs
    
    Structured Logging
    
    可觀測性(logging)實戰
  - C#
    C#
    
    後端 API
    後端 API
    
    使用 NET Core 創建 Web API
    
    儀器化 Net Core 應用程序
    
    結構化日誌 Net Core 應用程序
  - Java
    Java
    
    後端 API
    後端 API
    
    使用 Springboot 創建 Web API
    
    儀器化 Springboot 應用程序
    
    結構化日誌 Sprintboot 應用程序
- SRE
  SRE
  - 概念
    概念
    
    基於 SLO 告警
  - 工具
    工具
    
    Sloth
    Sloth
    
    概念
    概念
    
    Sloth 是什麼？
    
    安裝
    安裝
    
    Helm 安裝與功能驗證
    
    Pyrra
    Pyrra
    
    概念
    概念
    
    Pyrra 是什麼？
    
    安裝
    安裝
    
    Helm 安裝與功能驗證
    
    SLO 範例
    SLO 範例
    
    Prometheus
- Prometheus
  Prometheus
  - 基礎
    基礎
    
    Prometheus 簡介
    
    Prometheus 安裝配置
  - Node Exporter
    Node Exporter
    
    Exporter 簡介
    
    安裝配置
    
    常用監控指標
  - PromQL
    PromQL
    
    基礎
    基礎
    
    PromQL 簡介
    
    數據模型
    
    指標類型
    
    演示服務
    
    查詢
    查詢
    
    查詢基礎
    
    選擇時間序列
    
    變化率
    
    聚合
    
    運算
    
    閾值
    
    集合操作
    
    排序
    
    直方圖
    
    數據對比
    
    檢測
    
    補充
    補充
    
    Range query 的 step 參數說明
    
    搞懂 Prometheus 的直方圖
    
    簡單理解 Summary 和 Histogram 指標
  - Alertmanager
    Alertmanager
    
    Alertmanager 安裝
    
    報警規則
    
    報警接收器
    
    報警過濾
    
    補充
    補充
    
    Promtheus 到底啥時候報警?
  - Grafana
    Grafana
    
    Grafana 簡介
    
    視覺化面板
    視覺化面板
    
    面板介詔
    
    圖形面板
    
    圖形定制
    
    表格面板
    
    儀錶盤面板
    
    統計面板
    
    文本面板
  - Prometheus Operator
    Prometheus Operator
    
    Prometheus Operator 簡介
    
    自定義監控報警
    
    Dashboard 的 GitOps 方式
    
    使用 ConfigMap 管理 Grafana 儀表板
  - Operation Runbook
    Operation Runbook
    
    Operation Runbook 簡介
  - PostgresExporter
    PostgresExporter
    
    使用 Prometheus 監控 PostgreSQL
- OpenTelemetry
  OpenTelemetry
  - Instrumentation
    
    Instrumentation
    
    分佈式追踪概念
    
    Java
    
    Java
    
    Automatic
    
    Automatic
    
    Python
    Python
    
    Tracing API
  - Collector
    
    Collector
  - K8s Operator
    
    K8s Operator
  - 範例
    範例
    
    如何使用 OTEL agent 捕獲 Spring Boot 指標
- Grafana
  Grafana
  - Tempo
    Tempo
    
    示例
    示例
    
    Hot ROD 應用
  - Tempo(v2)
    Tempo(v2)
    
    示例
    示例
    
    Hot ROD 應用
- ArgoCD
  ArgoCD
  - 概念
    概念
    
    Argo CD 是什麼？
  - 入門
    入門
    
    Getting Started
    
    手把手教程
    
    手把手教程
    
    ArgoCD 安裝設定
    
    ArgoCD 入門
    
    Kustomize
    
    SyncWaves 與 Hooks
    
    ApplicationSet 控制器
  - 維運
    維運
    
    指標 Metrics
    
    指標 Metrics
    
    可觀測性(metrics)實戰
  - ArgoCD 插件
    ArgoCD 插件
    
    使用 Argo CD Vault 插件進行 Secret 管理
  - ApplicationSet Controller
    ApplicationSet Controller
    
    簡介
    
    用例
    
    ApplicationSet 控制器與 Argo CD 整合
    
    Generator 生成器
    
    Generator 生成器
    
    List Generator
    
    Cluster Generator
    
    Git Generator
    
    範本 fields
- Istio
  Istio
  - 概念
    概念
    
    Istio 是什麼？
    
    流量管理
    
    可觀測性
    
    安全
  - 安裝
    安裝
    
    使用 Helm 安裝
    
    Istio+OTel+Tempo 大全配
    
    Istio+OTel+Tempo 大全配 (RKE2)
    
    Istio+OTel+Tempo 大全配 (CCoE)
    
    更多指南
    更多指南
    
    安裝配置文件
  - 示例
    示例
    
    Bookinfo 應用
  - 參考
    參考
    
    應用程序部署策略
    
    Istio Ingress 與 K8S Ingress
- Dex
  Dex
  - 概述
    概述
    
    入門
    
    ID 令牌
    
    編寫使用 Dex 的應用程序
    
    OpenID Connect 概述
    
    v2 中的新功能
    
    Scopes,Claims與Client功能
    
    存儲選項
  - Connectors
    
    Connectors
    
    OpenID Connect
    
    OAuth 2.0
    
    範例
    範例
    
    OpenID Connect
- Minio
  Minio
  - Administration
    Administration
    
    Minio Console
    
    Minio Console
    
    安全和訪問
    
    身份和訪問管理
    身份和訪問管理
    
    訪問管理
  - 教學範例
    教學範例
    
    Minio 簡介
    
    Minio Bucket Policy 教程
    
    Minio policy 使用
- Vault
  Vault
  - Docs
    Docs
    
    Auth Methods
    Auth Methods
    
    Overview
    
    Kubernetes
    
    Username & Password
    
    Platform
    Platform
    
    Kubernetes
    
    Kubernetes
    
    Helm
    
    Helm
  - Tutorials
    Tutorials
    
    Kubernetes
    Kubernetes
    
    通過 Vault Agent 容器將 Secret 注入 Kubernetes Pod
    
    通過容器存儲接口 (CSI) 掛載 Vault Secret
    
    Vault Agent 與 Kubernetes
    
    Kubernetes 與外部 Vault 整合
- Ansible
  Ansible
  - 快速入門
    快速入門
    
    Vagrant 快速入門
    
    Ansible 快速入門
    
    Ansible 使用基於 SSH 密碼登入
    
    Ansible 使用指南
  - Ansible Playbook 撰寫
    Ansible Playbook 撰寫
    
    如何創建與運行
    
    如何定義任務
    
    如何使用變量
    
    如何訪問系統信息
    
    如何使用條件
    
    如何使用循環
    
    了解權限提升
    
    如何安裝和管理系統包
    
    如何創建和使用模板
    
    如何定義和使用處理程序
    
    如何使用Nginx部署靜態HTML網站
  - Ansible AWX 教學
    Ansible AWX 教學
    
    如何在 Ubuntu 20.04 上安裝 Ansible AWX
    
    Ansible AWX 基本使用和配置
  - 教學
    教學
    
    如何在 Ubuntu 20.04 上安裝 Docker
    
    如何使用 Ansible 在 Ubuntu 20.04 上安裝和設置 Docker
    
    如何在 Ubuntu 22.04 上安裝和配置 Ansible
MLOps
MLOps
- Getting started
  Getting started
  - 學習環境
    學習環境
    
    Kubeadm
    Kubeadm
    
    支援 Nvidia GPU
    
    Rancher RKE2/K3S
    Rancher RKE2/K3S
    
    支援 Nvidia GPU
    
    分析 Nvidia GPU Operator
  - GPU 共享
    GPU 共享
    
    Nvidia GPU 共享的機制
    
    提高 GPU 利用率
    提高 GPU 利用率
    
    Time-slicing
    
    MIG
    MIG
    
    MIG 概念
    
    MIG 切割入門
    
    Kubernetes 對 MIG 支持
    
    GPU 持久化模式
    
    GPU 的 MIG-PARTED 工具
    
    GPU Operator 與 MIG 配置
- Kubeflow
  Kubeflow
  - 簡介
    
    簡介
    
    架構
    
    安裝
    
    視頻教學
  - 組件
    組件
    
    Central Dashboard
    Central Dashboard
    
    簡介
    
    自定義 menu 項
    
    Kubeflow Notebooks
    Kubeflow Notebooks
    
    概述
    
    快速入門
    
    容器鏡像
    
    範例
    範例
    
    Tesorflow(Mnist)
    
    提交 Kubernetes 資源
    
    除錯
    
    Kubeflow Pipelines
    Kubeflow Pipelines
    
    v1
    v1
    
    簡介
    
    概述
    概述
    
    Quickstart
    
    管道 interface
    
    Multi-user 隔離
    
    Pipeline Root
    
    概念
    概念
    
    Pipeline
    
    Component
    
    Graph
    
    Experiment
    
    Run 與 Recurring Run
    
    Run Trigger
    
    Step
    
    Output Artifact
    
    ML Metadata
    
    管道運行比對
    
    範例和教程
    範例和教程
    
    DSL-Control結構
    
    Pipelines 輕量級組件
    
    v2
    v2
    
    簡介
    
    Hello World 範例管道
    
    從 KFP SDK v1 遷移
    
    安裝
    安裝
    
    Quickstart
    
    組件
    
    組件
    
    輕量級 Python 組件
    
    容器化 Python 組件
    
    容器組件
    
    Importer 組件
    
    附加功能
    
    管道
    管道
    
    Pipeline 基礎
    
    控制 Flow
    
    資料型別
    
    資料型別
    
    Parameters
    
    Artifacts
    
    補充
    補充
    
    機器學習的效能衡量指標
    
    編譯 Pipeline
    
    載入與分享組件
    
    運行管道
    
    管道運行比對
    
    命令行界面
    
    Katib
    Katib
    
    簡介
    
    開始使用 Katib
    
    運行實驗
    
    回復實驗
    
    Trial Templates 概述
    
    使用 Early Stopping
    
    Katib Configuration 簡介
    
    Katib 組件的環境變量
    
    Multi-Tenancy
    Multi-Tenancy
    
    多用戶隔離介詔
    
    多用戶隔離入門
    
    Profile(CRD)
    
    身份驗證設計
    身份驗證設計
    
    AuthService (OIDC代理)
    
    AuthService 網頁模板
    
    使用Istio+Dex進行身份驗證
    
    使用Keycloak進行身份驗證
    
    外部整合插件
    外部整合插件
    
    KServe
    KServe
    
    KServe 簡介
    
    快速入門
    快速入門
    
    KServe 入門
    
    InferenceService 初試
    
    啟用 Swagger UI
    
    Model UI
    
    用戶指南
    用戶指南
    
    概念
    概念
    
    Control Plane
    Control Plane
    
    簡介
    
    Data Plane
    Data Plane
    
    簡介
    
    Data Plane (V1)
    
    Data Plane (V2)
    
    模型推論 Runtimes
    
    單一模型推論 Runtime
    單一模型推論 Runtime
    
    模型框架/格式
    模型框架/格式
    
    模型推論 Runtime 簡介
    
    Tensorflow
    
    PyTorch
    
    Scikit-learn
    
    Transformer
    Transformer
    
    撰寫客制 Transformer
    
    模型監測
    模型監測
    
    使用 Alibi 異常值/漂移檢測器
    
    Model 存儲
    Model 存儲
    
    Azure
    
    S3
    
    Minio
    
    URI
    
    Feature Store
    Feature Store
    
    Feast 簡介
    
    範例
    範例
    
    Notebooks
    Notebooks
    
    構建客制容器鏡像
    
    JupyterLab
    JupyterLab
    
    Notebook 結合 Git/GitHub
    
    JupyterLab Git 擴展 HowTo
    
    JupyterLab Git 擴展 HowTo-2
    
    MLOps
    MLOps
    
    使用 Kubeflow 識別數字圖像
    
    Pipeline
    Pipeline
    
    使用 Kubeflow 構建機器學習管道
    
    如何從頭開始構建第一個管道
- Seldon
  Seldon
  - 概念
    概念
    
    Seldon 核心組件概述
  - 範例
    範例
    
    學習環境
    
    快速入門指南
Kserve
Kserve
- User Guide
  User Guide
  - 概念
    概念
    
    控制平面
    控制平面
    
    Model Serving控制平面
  - 模型ServingRuntime
    模型ServingRuntime
    
    XGBoost
    
    XGBoost
MLflow
MLflow
- Model Evaluation
  Model Evaluation
- TraditionalML
  TraditionalML
  - 教程和指南
    教程和指南
    
    構建客制 Python Function 模型
    
    構建客制 Python Function 模型
    
    Models, Flavors, and PyFuncs
    
    Understanding PyFunc
    
    範例
    範例
    
    建立自訂模型 "Add N"
    
    利薩茹 Lissajous 曲線自訂模型
    
    自訂模型的 predict 方法
- Deployment
  Deployment
  - 佈署標的
    佈署標的
    
    本地推論服務部署
    
    在K8S部署推論服務
    
    在K8S部署推論服務
    
    Tutorial
- MLflow Tracking
  MLflow Tracking
  - 快速入門
  - 概念
  - 設定 MLflow Tracking 環境
    設定 MLflow Tracking 環境
    
    元件
    
    使用本地資料庫追蹤實驗
    
    進行遠端實驗追蹤
- System Metrics
  System Metrics
- MLflow Models
  MLflow Models
  - 模型存儲格式
  - 管理模型中的相依性
  - 模型簽章與輸入範例
  - 模型 API
  - 內建模型 Flavors
    內建模型 Flavors
    
    Python Function
    
    Keras(keras)
    
    PyTorch(pytorch)
    
    Scikit-learn(sklearn)
    
    TensorFlow(tensorflow)
    
    XGBoost(xgboost)
    
    LightGBM(lightgbm)
- MLflow Model Registry
  MLflow Model Registry
  - 概念
  - 模型註冊 Workflow
- MLflow Authentication
  MLflow Authentication
LLMs
LLMs
- Serving
  Serving
  - Ollama
    Ollama
    
    簡介
    
    導入客制模型
    
    FAQ
    
    環境變數
  - OpenLLM
    OpenLLM
    
    簡介
    
    基本使用
    
    模型支持
    
    語嵌入
    
    整合 LangChain
  - TextGen
    TextGen
    
    簡介
    
    基本使用
    
    擴展插件
    
    Chat 人物設定
    
    降低 GPU 顯存需求降低 GPU 顯存需求
    Table of contents
    
    以 8-bit 加載模型
    
    以 4-bit 加載模型
    
    將模型拆分到 GPU 和 CPU
    
    GTPQ 量化模型
    
    啟用 ExLlama
    
    使用 llama.cpp
- RAG
  RAG
  - RAG 資料同步
  - Vector Store
    Vector Store
    
    pgvector
    pgvector
    
    pgvector 簡介
    
    PostgreSQL (pgvector) 擴展實作
  - Text Splitters
    Text Splitters
    
    簡介
- Huggingface
  Huggingface
  - Datasets
    Datasets
    
    開始使用
    
    開始使用
    
    快速上手
    
    安裝
    
    教學
    
    教學
    
    載入 dataset
    
    了解 dataset
    
    數據預處理
    
    創建 dataset
    
    公開與共享 dataset
    
    操作指南
    操作指南
    
    概述
    
    基本用法
    基本用法
    
    載入 Dataset
    
    數據處理
    
    數據串流
    
    結合 Tensorflow 使用
    
    結合 PyTorch 使用
    
    結合 JAX 使用
    
    結合 Spark 使用
    
    緩存 management
    
    雲存儲服務整合
    
    Audio 數據
    Audio 數據
    
    載入 audio data
    
    處理 audio data
    
    創建 audio dataset
    
    Vision 數據
    Vision 數據
    
    載入 image data
    
    處理 image data
    
    創建 image dataset
    
    Depth estimation
    
    Image classification
    
    Semantic segmentation
    
    Object detection
    
    Text 數據
    Text 數據
    
    載入 text data
    
    處理 text data
    
    Tabular 數據
    Tabular 數據
    
    載入 tabular data
    
    底層概念
    底層概念
    
    Dataset 與 Arrow
    
    Dataset 緩存與指紋
    
    Dataset 與 IterableDataset 的差異
    
    Dataset features
    
    Dataset 構建並加載
    
    批次 mapping
  - Finetuning
    Finetuning
    
    PEFT
    PEFT
    
    LoRA
    LoRA
    
    LoRA 實現大模型 LLM 微調
    
    Adapter
    Adapter
    
    從 Prefix Tuning 到 LLaMA-Adapter
  - Tutorials
    Tutorials
    
    Tokenizer
    Tokenizer
    
    概念
    概念
    
    LLM 微調步驟-Tokenizing
    
    SentencePiece
    SentencePiece
    
    SentencePiece 原理與實踐
    
    Transfomer模型
    Transfomer模型
    
    PyTorch Transformer 詳細指南
    
    模型微調
    模型微調
    
    Llama2-7B
    Llama2-7B
    
    使用單一 GPU 微調 LLaMA2
    
    Falcon-7B
    Falcon-7B
    
    運行 Falcon-7B-Instruct 使用 4bit 量化
    
    Falcon 模型提供推論服務使用 🤗 TGI
    
    LLM 分片(sharding)
- Cohere
  Cohere
  - LEARN
    LEARN
    
    關鍵概念
    關鍵概念
    
    Embeddings
    
    Prompt Engineering
    
    Tokens
    
    生成
    生成
    
    Likelihood
    
    Number of Generations
    
    Temperature
    
    Top-k & Top-p
    
    Retrieval Augmented Generation (RAG)
- OpenAI
  OpenAI
  - Get Started
    Get Started
    
    簡介
    
    快速入門
  - Capabilities
    Capabilities
    
    Text generation
    
    Function calling
    
    Function calling
    
    範例
    範例
    
    Function calling 功能
    
    Embeddings
    
    Text-to-speech
    
    Speech-to-text
  - Guides
    Guides
    
    提示工程
    
    提示工程
    
    六個提示工程策略
    
    範例
    
    範例
    
    Grammar correction
    
    Parse unstructured data
    
    Calculate time complexity
    
    Keywords
    
    Python bug fixer
    
    Tweet classifier
    
    Mood to color
    
    Marv the sarcastic chat bot
    
    Interview questions
    
    Improve code efficiency
    
    Emoji chatbot
    
    Socratic tutor
    
    Meeting notes summarizer
    
    Pro and con discusser
    
    Summarize for a 2nd grader
    
    Emoji Translation
    
    Explain code
    
    Product name generator
    
    Spreadsheet creator
    
    Airport code extractor
    
    VR fitness idea generator
    
    Turn by turn directions
    
    Function from specification
    
    Single page website creator
    
    Memo writer
    
    Translation
    
    Natural language to SQL
    
    Review classifier
    
    Lesson plan writer
    
    安全最佳實踐
- Prompt
  Prompt
  - Prompt Engineering
    
    Prompt Engineering
    
    提示工程簡介
    
    提示工程簡介
    
    模型參數設定
    
    基本概念
    
    提示詞要素
    
    設計提示的通用技巧
    
    提示範例
    
    提示技術
    
    提示技術
    
    零樣本提示
    
    少樣本提示
    
    鍊式思考(CoT)
    
    自我一致性
    
    生成知識提示
    
    思維樹(ToT)
    
    檢索增強生成(RAG)
    
    自動推理並使用工具(ART)
    
    自動提示工程(APE)
    
    方向性刺激提示
    
    ReAct 框架
    
    多模態思維鏈提示
    
    Active-Prompt
  - Copilot
    Copilot
    
    Continue
    Continue
    
    簡介
AutoGluon
AutoGluon
- GET STARTED
  GET STARTED
- TUTORIALS
  TUTORIALS
  - Time Series
    Time Series
    
    Time Series Quick Start
    
    In Depth
MLServer
MLServer
- Getting Started
- User Guide
  User Guide
  - Content Type
- Examples
  Examples
Blog
Blog
- Archive
  Archive
  - 2025
  - 2024
  - 2023
- Categories
  Categories
  - CI
  - Copilot
  - Docker-in-docker
  - Finetuning
  - GTPQ
  - Gemini
  - GenAI
  - Huggingface
  - Jupyterlab
  - KPI
  - LLM
  - Llama2
  - Packaging
  - Platform
  - Prompt
  - PyPI
  - Python
  - QLoRA
  - RAG

低顯存指引¶

如果您的 GPU 的顯存不夠大，無法載入 16-bit 模型，請按以下順序嘗試這些操作：

以 8-bit 加載模型¶

python server.py --load-in-8bit

以 4-bit 加載模型¶

python server.py --load-in-4bit

將模型拆分到 GPU 和 CPU¶

python server.py --auto-devices

如果您可以使用此命令加載模型，但在嘗試生成文本時內存不足，請嘗試逐漸限制分配給 GPU 的內存量，直到錯誤停止發生：

python server.py --auto-devices --gpu-memory 10
python server.py --auto-devices --gpu-memory 9
python server.py --auto-devices --gpu-memory 8
...

其中數字以 GiB 為單位。

為了更好地控制，您還可以顯式指定 MiB 單位：

python server.py --auto-devices --gpu-memory 8722MiB
python server.py --auto-devices --gpu-memory 4725MiB
python server.py --auto-devices --gpu-memory 3500MiB
...