!unzip -u ../lec07/data/imdb_perf_lecture.zip -d ../lec07/data/

Archive:  ../lec07/data/imdb_perf_lecture.zip


!psql -h localhost -c 'DROP DATABASE IF EXISTS imdb_perf_lecture'
!psql -h localhost -c 'CREATE DATABASE imdb_perf_lecture' 
!psql -h localhost -d imdb_perf_lecture -f ../lec07/data/imdb_perf_lecture.sql

DROP DATABASE
CREATE DATABASE
SET
SET
SET
SET
SET
 set_config 
------------
 
(1 row)

SET
SET
SET
SET
SET
SET
CREATE TABLE
ALTER TABLE
CREATE TABLE
ALTER TABLE
CREATE TABLE
ALTER TABLE
COPY 845888
COPY 2211936
COPY 656453
ALTER TABLE
ALTER TABLE
ALTER TABLE
ALTER TABLE


%reload_ext sql

There's a new jupysql version available (0.10.10), you're running 0.10.0. To upgrade: pip install jupysql --upgrade
Deploy FastAPI apps for free on Ploomber Cloud! Learn more: https://ploomber.io/s/signup


%sql postgresql://127.0.0.1:5432/imdb_perf_lecture


%sql EXPLAIN ANALYZE SELECT * FROM Actor;


%sql EXPLAIN SELECT * FROM Actor;


%sql EXPLAIN ANALYZE SELECT id FROM Actor;


%sql EXPLAIN ANALYZE SELECT id FROM Actor WHERE id > 4000000;


%sql EXPLAIN ANALYZE SELECT id, name FROM Actor WHERE id > 4000000;


%%sql
EXPLAIN ANALYZE -- 1
SELECT id
FROM Actor
WHERE id > 4000000 AND name='Tom Hanks';


%%sql
EXPLAIN ANALYZE -- 2
SELECT id
FROM Actor
WHERE id < 4000000 AND name='Tom Hanks';


%%sql
EXPLAIN ANALYZE -- 3
SELECT id
FROM Actor;


%%sql
EXPLAIN ANALYZE -- 4
SELECT id
FROM Actor
LIMIT 10;


%config SqlMagic.displaylimit = None


%%sql
EXPLAIN ANALYZE -- 5
SELECT id
FROM Actor
ORDER BY name
LIMIT 10;

Lecture 08: Query Optimization I¶

New IMDB Performance database¶

Demo¶

Moar queries if time permits!¶

QUERY PLAN
Seq Scan on actor (cost=0.00..13684.88 rows=845888 width=18) (actual time=0.038..54.412 rows=845888 loops=1)
Planning Time: 0.041 ms
Execution Time: 78.266 ms

QUERY PLAN
Seq Scan on actor (cost=0.00..13684.88 rows=845888 width=4) (actual time=0.041..74.812 rows=845888 loops=1)
Planning Time: 0.040 ms
Execution Time: 98.669 ms

QUERY PLAN
Index Only Scan using actor_pkey on actor (cost=0.42..12630.93 rows=443343 width=4) (actual time=0.067..53.516 rows=444781 loops=1)
Index Cond: (id > 4000000)
Heap Fetches: 0
Planning Time: 0.104 ms
Execution Time: 66.626 ms

QUERY PLAN
Seq Scan on actor (cost=0.00..15799.60 rows=443343 width=18) (actual time=0.252..62.556 rows=444781 loops=1)
Filter: (id > 4000000)
Rows Removed by Filter: 401107
Planning Time: 0.064 ms
Execution Time: 75.123 ms