Spaces:

griddev
/

project_02_DS

Sleeping

App Files Files Community

project_02_DS / task /task_03 /step4_visualize.py

griddev

Deploy Streamlit Space app

f9b8c32 verified 15 days ago

raw

history blame contribute delete

11.6 kB

	"""
	step4_visualize.py
	===================
	Task 3 — Component 4: Visualize ablation results.

	Generates three publication-quality figures from the 9-config result data:

	1. cider_heatmap.png — 3×3 heatmap of CIDEr by (beam_size × length_penalty)
	2. latency_barchart.png — grouped bar chart of latency (s/100 images) per config
	3. metrics_scatter.png — BLEU-4 vs CIDEr scatter, coloured by beam size

	All figures are saved to `save_dir` (default: task/task_03/results/).

	Public API
	----------
	plot_cider_heatmap(results, save_dir="task/task_03/results") -> str (path)
	plot_latency_barchart(results, save_dir) -> str
	plot_metrics_scatter(results, save_dir) -> str
	visualize_all(results, save_dir) -> dict[str, str]

	Standalone usage
	----------------
	export PYTHONPATH=.
	venv/bin/python task/task_03/step4_visualize.py
	"""

	import os
	import sys
	import json

	sys.path.insert(0, os.path.dirname(os.path.dirname(os.path.dirname(os.path.abspath(__file__)))))

	import numpy as np
	import matplotlib
	matplotlib.use("Agg")
	import matplotlib.pyplot as plt
	import matplotlib.ticker as mticker

	BEAM_SIZES = [1, 3, 5]
	LENGTH_PENALTIES = [0.8, 1.0, 1.2]

	PALETTE = {1: "#4C72B0", 3: "#DD8452", 5: "#55A868"} # blue, orange, green


	# ─────────────────────────────────────────────────────────────────────────────
	# Helpers
	# ─────────────────────────────────────────────────────────────────────────────

	def _lookup(results: list, beam: int, lp: float, metric: str) -> float:
	for r in results:
	if r["beam_size"] == beam and abs(r["length_penalty"] - lp) < 1e-6:
	return r[metric]
	return 0.0


	# ─────────────────────────────────────────────────────────────────────────────
	# Figure 1 — CIDEr heatmap
	# ─────────────────────────────────────────────────────────────────────────────

	def plot_cider_heatmap(results: list, save_dir: str = "task/task_03/results") -> str:
	"""
	3×3 heatmap: rows = beam_size {1,3,5}, cols = length_penalty {0.8,1.0,1.2}.
	Cell value = CIDEr score. Warmer = higher quality.
	"""
	os.makedirs(save_dir, exist_ok=True)

	# Build 2-D grid
	grid = np.array([[_lookup(results, bs, lp, "cider")
	for lp in LENGTH_PENALTIES]
	for bs in BEAM_SIZES])

	fig, ax = plt.subplots(figsize=(7, 5))
	im = ax.imshow(grid, cmap="YlOrRd", aspect="auto",
	vmin=grid.min() - 0.02, vmax=grid.max() + 0.01)

	# Axis labels
	ax.set_xticks(range(len(LENGTH_PENALTIES)))
	ax.set_xticklabels([f"{lp:.1f}" for lp in LENGTH_PENALTIES], fontsize=12)
	ax.set_yticks(range(len(BEAM_SIZES)))
	ax.set_yticklabels([str(b) for b in BEAM_SIZES], fontsize=12)
	ax.set_xlabel("Length Penalty", fontsize=13, labelpad=8)
	ax.set_ylabel("Beam Size", fontsize=13, labelpad=8)
	ax.set_title("CIDEr Score Heatmap\nBeam Size × Length Penalty", fontsize=14, fontweight="bold", pad=12)

	# Annotate each cell
	best_val = grid.max()
	for i, bs in enumerate(BEAM_SIZES):
	for j, lp in enumerate(LENGTH_PENALTIES):
	val = grid[i, j]
	colour = "white" if val < best_val - 0.04 else "black"
	marker = "★" if abs(val - best_val) < 1e-4 else ""
	ax.text(j, i, f"{val:.4f}{marker}", ha="center", va="center",
	fontsize=10, fontweight="bold", color=colour)

	cbar = fig.colorbar(im, ax=ax, shrink=0.85)
	cbar.set_label("CIDEr Score", fontsize=11)
	fig.tight_layout()

	path = os.path.join(save_dir, "cider_heatmap.png")
	fig.savefig(path, dpi=150, bbox_inches="tight")
	plt.close(fig)
	print(f" ✅ Saved: {path}")
	return path


	# ─────────────────────────────────────────────────────────────────────────────
	# Figure 2 — Latency bar chart
	# ─────────────────────────────────────────────────────────────────────────────

	def plot_latency_barchart(results: list, save_dir: str = "task/task_03/results") -> str:
	"""
	Grouped bar chart: x = length_penalty groups, bars = beam sizes.
	y-axis = seconds per 100 images.
	"""
	os.makedirs(save_dir, exist_ok=True)

	x = np.arange(len(LENGTH_PENALTIES))
	width = 0.22
	offsets = [-width, 0, width]

	fig, ax = plt.subplots(figsize=(8, 5))

	for k, (bs, off) in enumerate(zip(BEAM_SIZES, offsets)):
	vals = [_lookup(results, bs, lp, "latency_per_100") for lp in LENGTH_PENALTIES]
	cider = [_lookup(results, bs, lp, "cider") for lp in LENGTH_PENALTIES]
	bars = ax.bar(x + off, vals, width, label=f"beam={bs}",
	color=PALETTE[bs], alpha=0.85, edgecolor="white", linewidth=0.5)
	# Annotate with CIDEr
	for bar, ci in zip(bars, cider):
	ax.text(bar.get_x() + bar.get_width() / 2,
	bar.get_height() + 0.2,
	f"C={ci:.3f}", ha="center", va="bottom",
	fontsize=7.5, color="#333333")

	ax.set_xticks(x)
	ax.set_xticklabels([f"lp={lp:.1f}" for lp in LENGTH_PENALTIES], fontsize=11)
	ax.set_xlabel("Length Penalty Config", fontsize=12)
	ax.set_ylabel("Latency (s / 100 images)", fontsize=12)
	ax.set_title("Generation Latency per Config\n(annotated with CIDEr score)", fontsize=13, fontweight="bold")
	ax.legend(title="Beam Size", fontsize=10, title_fontsize=10)
	ax.yaxis.set_minor_locator(mticker.AutoMinorLocator())
	ax.grid(axis="y", linestyle="--", alpha=0.4)
	fig.tight_layout()

	path = os.path.join(save_dir, "latency_barchart.png")
	fig.savefig(path, dpi=150, bbox_inches="tight")
	plt.close(fig)
	print(f" ✅ Saved: {path}")
	return path


	# ─────────────────────────────────────────────────────────────────────────────
	# Figure 3 — Quality trade-off scatter
	# ─────────────────────────────────────────────────────────────────────────────

	def plot_metrics_scatter(results: list, save_dir: str = "task/task_03/results") -> str:
	"""
	Scatter: x = latency (s/100), y = CIDEr.
	Each point = one config, coloured by beam size.
	Annotated with (beam, lp).
	Pareto-optimal frontier is drawn.
	"""
	os.makedirs(save_dir, exist_ok=True)

	fig, ax = plt.subplots(figsize=(8, 5.5))

	for r in results:
	col = PALETTE[r["beam_size"]]
	ax.scatter(r["latency_per_100"], r["cider"],
	color=col, s=120, zorder=3, edgecolors="white", linewidth=0.8)
	ax.annotate(f"b={r['beam_size']}\nlp={r['length_penalty']}",
	xy=(r["latency_per_100"], r["cider"]),
	xytext=(4, 4), textcoords="offset points",
	fontsize=7.5, color="#333")

	# Pareto frontier (max CIDEr for each latency bucket)
	sorted_r = sorted(results, key=lambda r: r["latency_per_100"])
	pareto_x, pareto_y = [], []
	best_cider = -1.0
	for r in sorted_r:
	if r["cider"] > best_cider:
	best_cider = r["cider"]
	pareto_x.append(r["latency_per_100"])
	pareto_y.append(r["cider"])
	ax.step(pareto_x, pareto_y, where="post", color="#e83e3e",
	linewidth=1.5, linestyle="--", label="Pareto Frontier", zorder=2)

	# Legend patches
	from matplotlib.patches import Patch
	legend_els = [Patch(facecolor=PALETTE[b], label=f"beam={b}") for b in BEAM_SIZES]
	legend_els.append(plt.Line2D([0], [0], color="#e83e3e", linestyle="--",
	label="Pareto Frontier"))
	ax.legend(handles=legend_els, fontsize=10)

	ax.set_xlabel("Latency (s / 100 images) ← faster", fontsize=12)
	ax.set_ylabel("CIDEr Score → better quality", fontsize=12)
	ax.set_title("Quality vs. Speed Trade-off\n(each point = one beam × lp config)",
	fontsize=13, fontweight="bold")
	ax.grid(linestyle="--", alpha=0.35)
	fig.tight_layout()

	path = os.path.join(save_dir, "quality_speed_scatter.png")
	fig.savefig(path, dpi=150, bbox_inches="tight")
	plt.close(fig)
	print(f" ✅ Saved: {path}")
	return path


	# ─────────────────────────────────────────────────────────────────────────────
	# Master: run all three figures
	# ─────────────────────────────────────────────────────────────────────────────

	def visualize_all(results: list, save_dir: str = "task/task_03/results") -> dict:
	"""
	Generate all three figures.

	Returns:
	dict with keys: 'heatmap', 'latency', 'scatter' → absolute paths.
	"""
	print("=" * 60)
	print(" Task 3 — Step 4: Generate Visualizations")
	print("=" * 60)
	paths = {
	"heatmap": plot_cider_heatmap(results, save_dir),
	"latency": plot_latency_barchart(results, save_dir),
	"scatter": plot_metrics_scatter(results, save_dir),
	}
	print(f"\n 3 figures saved to: {save_dir}")
	return paths


	# ─────────────────────────────────────────────────────────────────────────────
	# Standalone entrypoint
	# ─────────────────────────────────────────────────────────────────────────────

	if __name__ == "__main__":
	SAVE_DIR = os.path.join(os.path.dirname(os.path.abspath(__file__)), "results")
	CACHE_FILE = os.path.join(SAVE_DIR, "ablation_results.json")

	# Load pre-computed or cached results
	if os.path.exists(CACHE_FILE):
	with open(CACHE_FILE) as f:
	results = json.load(f)
	print(f" Loaded results from {CACHE_FILE}")
	else:
	from step3_run_ablation import PRECOMPUTED_RESULTS
	results = PRECOMPUTED_RESULTS

	paths = visualize_all(results, SAVE_DIR)
	print("\n✅ All done. Open the PNG files in the results/ folder.")
	for name, p in paths.items():
	print(f" {name:10}: {p}")