# Run this cell to set up imports
import numpy as np
import pandas as pd


%reload_ext sql


%sql postgresql://127.0.0.1:5432/postgres


!unzip -u data/imdb_perf_lecture.zip -d data/

Archive:  data/imdb_perf_lecture.zip


!psql -h localhost -c 'DROP DATABASE IF EXISTS imdb_perf_lecture'
!psql -h localhost -c 'CREATE DATABASE imdb_perf_lecture' 
!psql -h localhost -d imdb_perf_lecture -f data/imdb_perf_lecture.sql

DROP DATABASE
CREATE DATABASE
SET
SET
SET
SET
SET
 set_config 
------------
 
(1 row)

SET
SET
SET
SET
SET
SET
CREATE TABLE
ALTER TABLE
CREATE TABLE
ALTER TABLE
CREATE TABLE
ALTER TABLE
COPY 845888
COPY 2211936
COPY 656453
ALTER TABLE
ALTER TABLE
ALTER TABLE
ALTER TABLE


%reload_ext sql


%sql postgresql://127.0.0.1:5432/imdb_perf_lecture


%sqlcmd tables


%sqlcmd columns -t actor


%%sql
SELECT *
FROM pg_indexes
WHERE schemaname = 'public';


%%sql
SELECT * FROM Actor WHERE id = 23456;


%%sql
EXPLAIN ANALYZE SELECT * FROM Actor WHERE id = 23456;


%%sql
EXPLAIN ANALYZE SELECT * FROM Cast_info WHERE person_id = 23456;


%sql EXPLAIN ANALYZE SELECT * FROM Actor WHERE name = 'Tom Hanks';


%sql CREATE INDEX nameIdIndex ON Actor(name,id);


%sql EXPLAIN ANALYZE SELECT * FROM Actor WHERE name = 'Tom Hanks';


%sql EXPLAIN ANALYZE SELECT * FROM Actor WHERE id = 23456;


%sql EXPLAIN ANALYZE SELECT * FROM Actor WHERE 23456 <= id AND id < 23500;


%sql EXPLAIN ANALYZE SELECT * FROM Actor WHERE id >= 23456;


%sql EXPLAIN ANALYZE SELECT * FROM Actor WHERE 5 <= id AND id < 23457;


%sql EXPLAIN ANALYZE SELECT * FROM Actor WHERE id >= 23456 AND id < 23500;


%sql EXPLAIN ANALYZE SELECT * FROM Actor WHERE id >= 23456 AND id < 23457;


%sql EXPLAIN ANALYZE SELECT * FROM Actor WHERE id >= 23456 OR id < 23457;


%sql DROP INDEX nameIdIndex;


%sql --close postgresql://127.0.0.1:5432/imdb_perf_lecture


!psql -h localhost -c 'DROP DATABASE IF EXISTS imdb_perf_lecture'

DROP DATABASE

name	type	nullable	default	autoincrement	comment
id	INTEGER	False	None	False	None
name	TEXT	True	None	False	None

schemaname	tablename	indexname	tablespace	indexdef
public	actor	actor_pkey	None	CREATE UNIQUE INDEX actor_pkey ON public.actor USING btree (id)
public	movie	movie_pkey	None	CREATE UNIQUE INDEX movie_pkey ON public.movie USING btree (id)

Lecture 07¶

New IMDB Performance database¶

Display indexes¶

`EXPLAIN ANALYZE`¶

Creating new Indexes¶

Exercise: Types of Scans¶

Cleanup¶

Name
movie
cast_info
actor

QUERY PLAN
Index Scan using actor_pkey on actor (cost=0.42..8.44 rows=1 width=36) (actual time=0.013..0.014 rows=1 loops=1)
Index Cond: (id = 23456)
Planning Time: 0.050 ms
Execution Time: 0.026 ms

QUERY PLAN
Gather (cost=1000.00..22310.10 rows=16 width=8) (actual time=102.617..104.600 rows=3 loops=1)
Workers Planned: 2
Workers Launched: 2
-> Parallel Seq Scan on cast_info (cost=0.00..21308.50 rows=7 width=8) (actual time=68.875..100.138 rows=1 loops=3)
Filter: (person_id = 23456)
Rows Removed by Filter: 737311
Planning Time: 0.110 ms
Execution Time: 104.618 ms

QUERY PLAN
Gather (cost=1000.00..10631.77 rows=1 width=18) (actual time=0.221..25.475 rows=1 loops=1)
Workers Planned: 2
Workers Launched: 2
-> Parallel Seq Scan on actor (cost=0.00..9631.67 rows=1 width=18) (actual time=13.453..21.182 rows=0 loops=3)
Filter: (name = 'Tom Hanks'::text)
Rows Removed by Filter: 281962
Planning Time: 0.143 ms
Execution Time: 25.492 ms

Lecture 07¶

New IMDB Performance database¶

Display indexes¶

EXPLAIN ANALYZE¶

Creating new Indexes¶

Exercise: Types of Scans¶

Cleanup¶

`EXPLAIN ANALYZE`¶