ollama

2025-03-19 16:13:05 -05:00
parent d402c32813
commit 3249180cce
1 changed files with 19 additions and 2 deletions
--- a/hosts/nas/apps/ollama/default.nix
+++ b/hosts/nas/apps/ollama/default.nix
@@ -1,4 +1,17 @@
-{ config, ... }:
+{ config, pkgs, ... }:
+let
+  llamaPackage = pkgs.llama-cpp.overrideAttrs (old: {
+    src = pkgs.fetchFromGitHub {
+      owner  = "ggml-org";
+      repo   = "llama.cpp";
+      rev    = "b4920";
+      sha256 = "sha256-SnQIeY74JpAPRMxWcpklDH5D4CQvAgi0GYx5+ECk2J4=";
+    };
+    # Optionally override other attributes if you need to
+    # version = "my-fork-version";
+    # pname = "llama-cpp-custom";
+  });
+in
 {
  services.ollama = {
    enable = true;
@@ -11,12 +24,15 @@
    home = "/media/nas/ssd/nix-app-data/ollama";
  };

+  environment.systemPackages = [ llamaPackage ];
+
  services.llama-cpp = {
    enable = true;
    port = 8127;
    host = "0.0.0.0";
    openFirewall = true;
    model = "/media/nas/ssd/nix-app-data/llama-cpp/models/functionary-small-v3.2-GGUF/functionary-small-v3.2.Q4_0.gguf";
+    package = llamaPackage; # pkgs.unstable.llama-cpp;
    extraFlags = [
      "--n_gpu-layers"
      "500"
@@ -24,7 +40,8 @@
      "0"
      "--numa"
      "numactl"
-    ]
+      "--jinja"
+    ];
  };

  services.open-webui = {