Spaces:

NeerajCodz
/

aiBatteryLifeCycle

Running

App Files Files Community

aiBatteryLifeCycle / api /main.py

NeerajCodz

fix: dropdown and frontend

7996ada about 1 month ago

raw

history blame contribute delete

18.2 kB

	"""
	api.main
	========
	FastAPI application entry-point for the AI Battery Lifecycle Predictor.

	Architecture
	------------
	- v1 (Classical) : Ridge, Lasso, ElasticNet, KNN ×3, SVR,
	Random Forest, XGBoost, LightGBM
	- v2 (Deep) : Vanilla LSTM, BiLSTM, GRU, Attention LSTM,
	BatteryGPT, TFT, iTransformer ×3, VAE-LSTM
	- v2.6 (Ensemble) : BestEnsemble — weighted average of RF + XGB + LGB
	(weights proportional to R²)

	Mounted routes
	--------------
	- ``/api/*`` REST endpoints (predict, batch, recommend, models, visualize)
	- ``/gradio`` Gradio interactive demo (optional, requires gradio package)
	- ``/`` React SPA (served from ``frontend/dist/``)

	Key endpoints
	-------------
	- ``POST /api/predict`` — single-cycle SOH + RUL prediction
	- ``POST /api/predict/ensemble`` — always uses BestEnsemble (v2.6)
	- ``POST /api/predict/batch`` — batch prediction from JSON array
	- ``GET /api/models`` — list all models with version / R² metadata
	- ``GET /api/models/versions`` — group models by generation (v1/v2)
	- ``GET /health`` — liveness probe

	Run locally
	-----------
	::

	uvicorn api.main:app --host 0.0.0.0 --port 7860 --reload

	Docker
	------
	::

	docker compose up --build
	"""

	from __future__ import annotations

	import asyncio
	from contextlib import asynccontextmanager
	from pathlib import Path

	from fastapi import BackgroundTasks, FastAPI, HTTPException
	from fastapi.middleware.cors import CORSMiddleware
	from fastapi.staticfiles import StaticFiles
	from fastapi.responses import FileResponse

	from api.model_registry import registry, registry_v1, registry_v2, registry_v3
	from api.schemas import HealthResponse
	from scripts.download_models import (
	select_top_models,
	DEFAULT_STARTUP_TOP_MODELS,
	ensure_metadata_first,
	write_datamap,
	)
	from src.utils.logger import get_logger

	log = get_logger(__name__)

	__version__ = "3.0.0"

	# ── Static frontend path ────────────────────────────────────────────────────
	_HERE = Path(__file__).resolve().parent
	_FRONTEND_DIST = _HERE.parent / "frontend" / "dist"


	# ── Lifespan ─────────────────────────────────────────────────────────────────
	@asynccontextmanager
	async def lifespan(app: FastAPI):
	"""Start API immediately; bootstrap top v3 models in background."""
	log.info("Loading model registries …")
	# Hard requirement: metadata must exist first for all versions.
	await asyncio.to_thread(ensure_metadata_first, ["v1", "v2", "v3"])
	for reg in _REGISTRIES.values():
	reg.refresh_metadata()

	_version_status["v3"] = "downloading"
	app.state.v3_bootstrap_task = asyncio.create_task(_bg_bootstrap_v3())
	log.info("v3 bootstrap started in background — API is available immediately")
	# v1 and v2 are NOT loaded at startup — download + load on-demand via
	# POST /api/versions/{v}/load to reduce startup time and memory usage.
	if _version_loaded("v1"):
	log.info("v1 artifacts present on disk (not loaded — use API to activate)")
	if _version_loaded("v2"):
	log.info("v2 artifacts present on disk (not loaded — use API to activate)")
	yield
	t = getattr(app.state, "v3_bootstrap_task", None)
	if t and not t.done():
	t.cancel()
	log.info("Shutting down battery-lifecycle API")


	# ── App ──────────────────────────────────────────────────────────────────────
	app = FastAPI(
	title="AI Battery Lifecycle Predictor",
	description=(
	"Predict SOH, RUL, and degradation state of Li-ion batteries "
	"using models trained on the NASA PCoE dataset."
	),
	version=__version__,
	lifespan=lifespan,
	docs_url="/docs",
	redoc_url="/redoc",
	)

	# CORS
	app.add_middleware(
	CORSMiddleware,
	allow_origins=["*"],
	allow_credentials=True,
	allow_methods=["*"],
	allow_headers=["*"],
	)


	# ── Health check ─────────────────────────────────────────────────────────────
	@app.get("/health", response_model=HealthResponse, tags=["meta"])
	async def health():
	return HealthResponse(
	status="ok",
	version=__version__,
	models_loaded=registry_v1.model_count + registry_v2.model_count + registry_v3.model_count,
	device=registry.device,
	)


	# ── Version management ───────────────────────────────────────────────────────
	_REGISTRIES = {"v1": registry_v1, "v2": registry_v2, "v3": registry_v3}
	_version_status: dict[str, str] = {} # "downloading" \| "ready" \| "error"
	_model_status: dict[str, str] = {} # "vX:model" -> status


	def _artifacts_dir() -> Path:
	return Path(__file__).resolve().parent.parent / "artifacts"


	def _version_loaded(version: str) -> bool:
	base = _artifacts_dir() / version / "models"
	if not base.exists():
	return False
	return any(base.rglob(".joblib")) or any(base.rglob(".pt")) or any(base.rglob("*.keras"))


	def _model_status_key(version: str, model_name: str) -> str:
	return f"{version}:{model_name}"


	@app.get("/api/versions", tags=["meta"])
	async def list_versions():
	"""Return all known versions with loaded / downloading status and metadata."""
	out = []
	for v in ["v3", "v2", "v1"]:
	reg = _REGISTRIES[v]
	reg.ensure_metadata_loaded()
	on_disk = _version_loaded(v)
	in_memory = reg.model_count > 0
	meta = reg._version_meta # from models.json (loaded in __init__)
	out.append({
	"id": v,
	"display": meta.get("display", v),
	"description": meta.get("description", ""),
	"features": meta.get("features"),
	"champion": meta.get("champion"),
	"on_disk": on_disk,
	"loaded": on_disk and in_memory,
	"model_count": reg.model_count,
	"catalog_count": len(reg._catalog),
	"status": _version_status.get(
	v,
	"ready" if in_memory else ("on_disk" if on_disk else "not_downloaded"),
	),
	})
	return out


	async def _bg_load_version(version: str) -> None:
	import sys as _sys
	try:
	proc = await asyncio.create_subprocess_exec(
	_sys.executable, "scripts/download_models.py", "--version", version,
	stdout=asyncio.subprocess.PIPE, stderr=asyncio.subprocess.STDOUT,
	)
	await proc.wait()
	if proc.returncode == 0:
	_REGISTRIES[version].refresh_metadata()
	_REGISTRIES[version].load_all()
	_version_status[version] = "ready"
	log.info("Version %s loaded on demand — %d models", version,
	_REGISTRIES[version].model_count)
	else:
	_version_status[version] = "error"
	log.error("download_models.py failed for version %s", version)
	except Exception as exc:
	_version_status[version] = "error"
	log.error("Failed to load version %s: %s", version, exc)


	async def _bg_bootstrap_v3() -> None:
	"""Download metadata + top startup models, then load them into memory."""
	import sys as _sys

	try:
	proc = await asyncio.create_subprocess_exec(
	_sys.executable,
	"scripts/download_models.py",
	stdout=asyncio.subprocess.PIPE,
	stderr=asyncio.subprocess.STDOUT,
	)
	await proc.wait()
	if proc.returncode != 0:
	_version_status["v3"] = "error"
	log.error("Startup model download failed for v3")
	return

	startup_models = select_top_models("v3")
	if startup_models:
	registry_v3.refresh_metadata()
	registry_v3.load_all(only_models=set(startup_models))
	log.info(
	"v3 registry ready — %d models loaded (startup top-%d set: %s)",
	registry_v3.model_count,
	DEFAULT_STARTUP_TOP_MODELS,
	", ".join(startup_models),
	)
	else:
	registry_v3.load_all()
	log.warning("Top model selection unavailable; loaded full v3 registry")

	_version_status["v3"] = "ready"
	except asyncio.CancelledError:
	log.info("v3 bootstrap task cancelled")
	raise
	except Exception as exc:
	_version_status["v3"] = "error"
	log.error("Failed during v3 bootstrap: %s", exc)


	async def _bg_download_model(version: str, model_name: str) -> None:
	import sys as _sys

	key = _model_status_key(version, model_name)
	try:
	proc = await asyncio.create_subprocess_exec(
	_sys.executable,
	"scripts/download_models.py",
	"--version",
	version,
	"--model",
	model_name,
	stdout=asyncio.subprocess.PIPE,
	stderr=asyncio.subprocess.STDOUT,
	)
	await proc.wait()
	_REGISTRIES[version].refresh_metadata()
	if proc.returncode == 0 and _REGISTRIES[version].model_on_disk(model_name):
	_model_status[key] = "on_disk"
	log.info("Model %s/%s downloaded on demand", version, model_name)
	else:
	_model_status[key] = "error"
	log.error("Failed to download model %s/%s", version, model_name)
	except Exception as exc:
	_model_status[key] = "error"
	log.error("Failed to download model %s/%s: %s", version, model_name, exc)


	@app.post("/api/versions/{version}/load", tags=["meta"])
	async def load_version(version: str, background_tasks: BackgroundTasks):
	"""Download + activate a model version from HF Hub (runs in background)."""
	if version not in _REGISTRIES:
	raise HTTPException(status_code=400, detail=f"Unknown version '{version}'")
	await asyncio.to_thread(ensure_metadata_first, [version])
	_REGISTRIES[version].refresh_metadata()
	if _version_status.get(version) == "downloading":
	return {"status": "downloading", "version": version}
	# If artifacts exist on disk but not loaded, just load without downloading
	if _version_loaded(version) and _REGISTRIES[version].model_count == 0:
	_REGISTRIES[version].load_all()
	_version_status[version] = "ready"
	log.info("Version %s loaded from disk — %d models", version, _REGISTRIES[version].model_count)
	return {"status": "ready", "version": version}
	_version_status[version] = "downloading"
	background_tasks.add_task(_bg_load_version, version)
	return {"status": "downloading", "version": version}


	# ── Models metadata endpoint ──────────────────────────────────────────────────
	import json as _json


	@app.get("/api/versions/{version}/models-meta", tags=["meta"])
	async def get_version_models_meta(version: str):
	"""Return models.json metadata for a specific version."""
	if version not in _REGISTRIES:
	raise HTTPException(status_code=400, detail=f"Unknown version '{version}'")
	await asyncio.to_thread(ensure_metadata_first, [version])
	_REGISTRIES[version].refresh_metadata()
	meta_path = _artifacts_dir() / version / "models.json"
	if not meta_path.exists():
	raise HTTPException(status_code=404, detail=f"models.json not found for {version}")
	datamap_path = _artifacts_dir() / version / "datamap.json"
	if not datamap_path.exists():
	await asyncio.to_thread(write_datamap, version)
	return {
	"models_meta": _json.loads(meta_path.read_text(encoding="utf-8")),
	"datamap": _json.loads(datamap_path.read_text(encoding="utf-8")) if datamap_path.exists() else {},
	}


	@app.get("/api/versions/{version}/datamap", tags=["meta"])
	async def get_version_datamap(version: str):
	"""Return datamap.json for a specific version; generate if missing."""
	if version not in _REGISTRIES:
	raise HTTPException(status_code=400, detail=f"Unknown version '{version}'")
	await asyncio.to_thread(ensure_metadata_first, [version])
	datamap_path = _artifacts_dir() / version / "datamap.json"
	if not datamap_path.exists():
	await asyncio.to_thread(write_datamap, version)
	return _json.loads(datamap_path.read_text(encoding="utf-8"))


	@app.get("/api/versions/{version}/models", tags=["meta"])
	async def list_version_models(version: str):
	"""List all models in models.json with disk/memory/load status."""
	if version not in _REGISTRIES:
	raise HTTPException(status_code=400, detail=f"Unknown version '{version}'")

	await asyncio.to_thread(ensure_metadata_first, [version])
	reg = _REGISTRIES[version]
	reg.refresh_metadata()
	rows = []
	for model_name, info in reg._catalog.items():
	key = _model_status_key(version, model_name)
	status = _model_status.get(key)
	loaded = model_name in reg.models
	if status is None:
	status = "ready" if loaded else ("on_disk" if reg.model_on_disk(model_name) else "not_downloaded")
	rows.append({
	"name": model_name,
	"display_name": info.get("display_name", model_name),
	"family": info.get("family", "unknown"),
	"r2": info.get("r2"),
	"has_file": bool(info.get("file")),
	"on_disk": reg.model_on_disk(model_name),
	"loaded": loaded,
	"status": status,
	})
	return rows


	@app.post("/api/versions/{version}/models/{model_name}/load", tags=["meta"])
	async def load_single_model(version: str, model_name: str, background_tasks: BackgroundTasks):
	"""Two-step per-model action: download first, then load into memory."""
	if version not in _REGISTRIES:
	raise HTTPException(status_code=400, detail=f"Unknown version '{version}'")

	await asyncio.to_thread(ensure_metadata_first, [version])
	reg = _REGISTRIES[version]
	reg.refresh_metadata()
	if model_name not in reg._catalog:
	raise HTTPException(status_code=404, detail=f"Unknown model '{model_name}' in {version}")

	# Virtual models have no direct downloadable artifact.
	if not reg._catalog.get(model_name, {}).get("file"):
	if reg.load_model(model_name):
	return {"status": "ready", "version": version, "model": model_name}
	raise HTTPException(status_code=400, detail=f"Model '{model_name}' cannot be loaded directly")

	key = _model_status_key(version, model_name)
	if _model_status.get(key) == "downloading":
	return {"status": "downloading", "version": version, "model": model_name}

	if reg.model_on_disk(model_name):
	if reg.load_model(model_name):
	_model_status[key] = "ready"
	return {"status": "ready", "version": version, "model": model_name}
	_model_status[key] = "error"
	raise HTTPException(status_code=500, detail=f"Model '{model_name}' exists on disk but failed to load")

	_model_status[key] = "downloading"
	background_tasks.add_task(_bg_download_model, version, model_name)
	return {"status": "downloading", "version": version, "model": model_name}


	# ── Include routers ──────────────────────────────────────────────────────────
	from api.routers.predict import router as predict_router, v1_router
	from api.routers.predict_v2 import router as predict_v2_router
	from api.routers.predict_v3 import router as predict_v3_router
	from api.routers.visualize import router as viz_router
	from api.routers.simulate import router as simulate_router

	app.include_router(predict_router) # /api/* (default, uses v2 registry)
	app.include_router(v1_router) # /api/v1/* (legacy v1 models)
	app.include_router(predict_v2_router) # /api/v2/* (v2 models)
	app.include_router(predict_v3_router) # /api/v3/* (v3 models, best accuracy)
	app.include_router(simulate_router) # /api/v3/simulate (ML-driven simulation)
	app.include_router(viz_router)


	# ── Mount Gradio ─────────────────────────────────────────────────────────────
	try:
	import gradio as gr
	from api.gradio_app import create_gradio_app

	gradio_app = create_gradio_app()
	app = gr.mount_gradio_app(app, gradio_app, path="/gradio")
	log.info("Gradio UI mounted at /gradio")
	except ImportError:
	log.warning("Gradio not installed — /gradio endpoint unavailable")


	# ── Serve React SPA ──────────────────────────────────────────────────────────
	if _FRONTEND_DIST.exists() and (_FRONTEND_DIST / "index.html").exists():
	app.mount("/assets", StaticFiles(directory=str(_FRONTEND_DIST / "assets")), name="static-assets")

	@app.get("/{full_path:path}", include_in_schema=False)
	async def spa_catch_all(full_path: str):
	"""Serve React SPA for any path not matched by API routes."""
	file_path = _FRONTEND_DIST / full_path
	if file_path.is_file():
	return FileResponse(file_path)
	return FileResponse(_FRONTEND_DIST / "index.html")

	log.info("React SPA served from %s", _FRONTEND_DIST)
	else:
	@app.get("/", include_in_schema=False)
	async def root():
	return {
	"message": "AI Battery Lifecycle Predictor API",
	"docs": "/docs",
	"gradio": "/gradio",
	"health": "/health",
	}