redis-applied-ai
diff --git a/‎CLAUDE.md‎
Lines changed: 0 additions & 31 deletions b/‎CLAUDE.md‎
Lines changed: 0 additions & 31 deletions
diff --git a/‎README.md‎
Lines changed: 41 additions & 2 deletions b/‎README.md‎
Lines changed: 41 additions & 2 deletions
diff --git a/‎app/agent/core.py‎
Lines changed: 220 additions & 1 deletion b/‎app/agent/core.py‎
Lines changed: 220 additions & 1 deletion
diff --git a/‎app/api/main.py‎
Lines changed: 21 additions & 1 deletion b/‎app/api/main.py‎
Lines changed: 21 additions & 1 deletion
@@ -42,8 +42,8 @@ uv sync
 cp .env.example .env
 # Edit .env with your API keys
 
-# Start Redis (with RedisJSON module for content management)
-docker run -d -p 6379:6379 redis/redis-stack:latest
+# Start Redis 8 (no Redis Stack required)
+docker run -d -p 6379:6379 redis:8-alpine
 
 # Seed database
 uv run python scripts/seed.py
@@ -93,6 +93,45 @@ TAVILY_API_KEY=your-tavily-key  # Web search tool
 REDIS_URL=redis://localhost:6379/0
 ```
 
+
+## Amazon Bedrock (LLM provider option)
+
+This repo includes scripts to automate IAM permissions for Bedrock and a local tool-calling test script.
+
+Prerequisites
+- AWS CLI v2 configured with credentials
+- Region: us-east-1 (default)
+
+1) Grant Bedrock invoke permissions to an IAM user
+```bash
+chmod +x scripts/bedrock_provision_access.sh
+scripts/bedrock_provision_access.sh user <YOUR_IAM_USER_NAME> us-east-1
+```
+This attaches a minimal policy that allows invoking Bedrock models and listing model info. If you see AccessDenied during inference, enable model access in the console.
+
+2) Enable model access (one-time, per account/region)
+Open the Bedrock Model access page and enable the providers/models you plan to use (default used here is Claude 3.5 Sonnet):
+- https://us-east-1.console.aws.amazon.com/bedrock/home?region=us-east-1#/model-access
+
+3) Switch provider to Bedrock and run locally
+```bash
+export AWS_DEFAULT_REGION=us-east-1
+export LLM_PROVIDER=bedrock
+export BEDROCK_MODEL_ID=anthropic.claude-3-5-sonnet-20240620-v1:0
+export LOG_LEVEL=INFO
+uv run python -m app.worker &
+uv run fastapi dev app/api/main.py
+```
+You should see logs like: "LLM configured: provider=bedrock model=anthropic.claude-3-5-sonnet-20240620-v1:0"
+
+Optional: add to your .env for convenience
+```bash
+AWS_DEFAULT_REGION=us-east-1
+BEDROCK_MODEL_ID=anthropic.claude-3-5-sonnet-20240620-v1:0
+# Future toggle; default provider may be Bedrock in this repo
+LLM_PROVIDER=bedrock
+```
+
 ## Deployment (AWS, single environment)
 
 This reference deploys a working agent stack on AWS with a single `terraform apply`:
 
@@ -20,6 +20,11 @@
 from redisvl.utils.vectorize import OpenAITextVectorizer
 
 from app.agent.tools import get_search_knowledge_base_tool, get_web_search_tool
+from app.utilities.bedrock_client import (
+    bedrock_text_blocks_to_text,
+    get_bedrock_runtime_client,
+    map_openai_tools_to_bedrock_tool_config,
+)
 from app.utilities.openai_client import get_instrumented_client
 
 logger = logging.getLogger(__name__)
@@ -308,6 +313,19 @@ async def answer_question(
         thread_context: Optional conversation context
         progress_callback: Optional callback function to send progress updates
     """
+    # Provider toggle: route to Bedrock implementation when requested
+    provider = os.getenv("LLM_PROVIDER", "bedrock").lower()
+    if provider == "bedrock":
+        return await answer_question_bedrock(
+            index=index,
+            vectorizer=vectorizer,
+            query=query,
+            session_id=session_id,
+            user_id=user_id,
+            thread_context=thread_context,
+            progress_callback=progress_callback,
+        )
+
     # Get the underlying OpenAI client for direct access
     client = get_instrumented_client()._client
 
@@ -333,6 +351,8 @@ async def answer_question(
         *MemoryAPIClient.get_all_memory_tool_schemas(),
     ]
 
+    logger.info(f"Using LLM provider=openai model={CHAT_MODEL}")
+
     logger.info(f"Available tools: {[tool['function']['name'] for tool in tools]}")
 
     # Track total tokens and tool calls across all iterations
@@ -561,7 +581,7 @@ async def answer_question(
 
     # Record metrics for this answer completion
     try:
-        from app.metrics import get_token_metrics
+        from app.utilities.metrics import get_token_metrics
 
         token_metrics = get_token_metrics()
         if token_metrics:
@@ -652,3 +672,202 @@ def _parse_llm_response(content: str) -> tuple[str, bool]:
     except Exception as e:
         logger.error(f"Error parsing LLM response: {e}")
         return content, False
+
+
+async def answer_question_bedrock(
+    index: AsyncSearchIndex,
+    vectorizer: OpenAITextVectorizer,
+    query: str,
+    session_id: str,
+    user_id: str,
+    thread_context: list[dict] | None = None,
+    progress_callback=None,
+) -> str:
+    """Bedrock-based implementation of the agent loop using Converse API with tools."""
+    client = get_bedrock_runtime_client()
+    model_id = os.getenv(
+        "BEDROCK_MODEL_ID", "anthropic.claude-3-5-sonnet-20240620-v1:0"
+    )
+    logger.info(f"Using LLM provider=bedrock model={model_id}")
+
+    initial_message = create_initial_message_without_search(query, thread_context)
+    bedrock_messages: list[dict] = [
+        {"role": "user", "content": [{"text": initial_message}]}
+    ]
+
+    tools_openai = [
+        get_search_knowledge_base_tool(),
+        get_web_search_tool(),
+        *MemoryAPIClient.get_all_memory_tool_schemas(),
+    ]
+    tool_config = map_openai_tools_to_bedrock_tool_config(tools_openai)
+
+    max_iterations = 25
+    iteration = 0
+    total_tokens = 0
+    total_tool_calls = 0
+
+    while iteration < max_iterations:
+        iteration += 1
+        response = client.converse(
+            modelId=model_id,
+            system=[{"text": SYSTEM_PROMPT}],
+            messages=bedrock_messages,
+            toolConfig=tool_config,
+        )
+
+        usage = response.get("usage") or {}
+        total_tokens += int(usage.get("inputTokens", 0)) + int(
+            usage.get("outputTokens", 0)
+        )
+
+        output_message = response.get("output", {}).get("message", {})
+        stop_reason = response.get("stopReason")
+
+        if stop_reason == "tool_use":
+            # Collect toolUse requests and produce toolResult blocks
+            tool_result_blocks: list[dict] = []
+            if progress_callback:
+                await progress_callback("Using tools...")
+
+            for block in output_message.get("content", []) or []:
+                tool_use = block.get("toolUse") if isinstance(block, dict) else None
+                if not tool_use:
+                    continue
+                name = tool_use.get("name")
+                tool_use_id = tool_use.get("toolUseId")
+                input_payload = tool_use.get("input") or {}
+                total_tool_calls += 1
+
+                try:
+                    if name == "search_knowledge_base":
+                        if progress_callback:
+                            await progress_callback("Searching knowledge base...")
+                        from app.agent.tools.search_knowledge_base import (
+                            search_knowledge_base,
+                        )
+
+                        q = (input_payload or {}).get("query", "")
+                        result_text = await search_knowledge_base(index, vectorizer, q)
+                        tool_result_blocks.append(
+                            {
+                                "toolResult": {
+                                    "toolUseId": tool_use_id,
+                                    "content": [{"text": str(result_text)}],
+                                    "status": "success",
+                                }
+                            }
+                        )
+                    elif name == "web_search":
+                        if progress_callback:
+                            await progress_callback("Searching the web...")
+                        from app.agent.tools.web_search import perform_web_search
+
+                        q = (input_payload or {}).get("query", "")
+                        web_res = await perform_web_search(
+                            query=q,
+                            search_depth="basic",
+                            max_results=5,
+                            redis_focused=True,
+                        )
+                        tool_result_blocks.append(
+                            {
+                                "toolResult": {
+                                    "toolUseId": tool_use_id,
+                                    "content": [{"text": str(web_res)}],
+                                    "status": "success",
+                                }
+                            }
+                        )
+                    else:
+                        # Memory tools or others resolved via memory client
+                        if progress_callback:
+                            await progress_callback("Using memory tools...")
+                        memory_client = await get_memory_client()
+                        # Enforce user_id for memory tools
+                        args = dict(input_payload or {})
+                        memory_tool_names = {
+                            "search_memory",
+                            "add_memory_to_working_memory",
+                            "update_working_memory_data",
+                            "get_working_memory",
+                            "search_long_term_memory",
+                            "memory_prompt",
+                            "set_working_memory",
+                        }
+                        if name in memory_tool_names:
+                            args["user_id"] = user_id
+                        function_call = {"name": name, "arguments": json.dumps(args)}
+                        mem_res = await memory_client.resolve_tool_call(
+                            tool_call=function_call,
+                            session_id=session_id,
+                            user_id=user_id,
+                        )
+                        tool_content = (
+                            str(mem_res)
+                            if isinstance(mem_res, (dict, list))
+                            else str(mem_res)
+                        )
+                        tool_content += "\n\nReflect on this memory tool result and your instructions about how to use memory tools. Make subsequent memory tool calls if necessary."
+                        tool_result_blocks.append(
+                            {
+                                "toolResult": {
+                                    "toolUseId": tool_use_id,
+                                    "content": [{"text": tool_content}],
+                                    "status": "success",
+                                }
+                            }
+                        )
+                except Exception as e:
+                    logger.error(f"Tool execution error for {name}: {e}")
+                    tool_result_blocks.append(
+                        {
+                            "toolResult": {
+                                "toolUseId": tool_use_id,
+                                "content": [
+                                    {"text": f"Error executing tool {name}: {str(e)}"}
+                                ],
+                                "status": "error",
+                            }
+                        }
+                    )
+
+            # Append assistant request and our tool results back to the conversation
+            bedrock_messages.append(output_message)
+            if tool_result_blocks:
+                bedrock_messages.append({"role": "user", "content": tool_result_blocks})
+            # Continue loop for model to produce next step
+            continue
+
+        # No tool use requested; treat as final answer
+        final_text = bedrock_text_blocks_to_text(output_message.get("content", []))
+        response_text, use_org_search = _parse_llm_response(final_text)
+        if use_org_search:
+            logger.info("LLM wanted to use org search, but org search is disabled")
+
+        # Metrics
+        try:
+            from app.utilities.metrics import get_token_metrics
+
+            token_metrics = get_token_metrics()
+            if token_metrics:
+                token_metrics.record_answer_completion(
+                    model=model_id,
+                    total_tokens=total_tokens,
+                    tool_calls=total_tool_calls,
+                )
+                logger.info(
+                    f"Recorded metrics for answer completion: model={model_id}, tokens={total_tokens}, tool_calls={total_tool_calls}"
+                )
+        except Exception as e:
+            logger.warning(f"Failed to record metrics for answer completion: {e}")
+
+        return response_text
+
+    # Max iterations reached; return last assistant text if any
+    last_text = (
+        bedrock_text_blocks_to_text(output_message.get("content", []))
+        if "output_message" in locals()
+        else ""
+    )
+    return last_text or "I'm sorry, I couldn't complete the request."
@@ -5,6 +5,7 @@
 """
 
 import logging
+import os
 from contextlib import asynccontextmanager
 
 from docket.docket import Docket
@@ -26,7 +27,10 @@
 from app.api.slack_app import get_slack_app
 from app.utilities import keys
 from app.utilities.environment import get_env_var
-from app.utilities.logging_config import configure_uvicorn_logging
+from app.utilities.logging_config import (
+    configure_uvicorn_logging,
+    ensure_stdout_logging,
+)
 from app.utilities.telemetry import setup_telemetry
 from app.worker.task_registration import register_all_tasks
 
@@ -344,6 +348,22 @@ async def lifespan(app: FastAPI):
     """FastAPI lifespan context manager."""
     print("Starting up FastAPI application with Docket...")
 
+    # Ensure logs go to stdout with a sane default
+    ensure_stdout_logging()
+
+    # Log LLM provider/model at API startup for visibility
+    try:
+        provider = os.getenv("LLM_PROVIDER", "bedrock").lower()
+        if provider == "bedrock":
+            model = os.getenv(
+                "BEDROCK_MODEL_ID", "anthropic.claude-3-5-sonnet-20240620-v1:0"
+            )
+        else:
+            model = os.getenv("OPENAI_CHAT_MODEL", "gpt-4.1")
+        logger.info(f"LLM configured: provider={provider} model={model} (api)")
+    except Exception as e:
+        logger.warning(f"Could not determine LLM provider/model on API startup: {e}")
+
     try:
         await setup_slack_app()