dsaiztc · July 2, 2019 15:51
diff --git a/queries.sql b/queries.sql
 -- Table information like sortkeys, unsorted percentage
 -- see http://docs.aws.amazon.com/redshift/latest/dg/r_SVV_TABLE_INFO.html
 SELECT * FROM svv_table_info;

 -- Table sizes in GB
 SELECT t.name, COUNT(tbl) / 1000.0 AS gb
 FROM (
  SELECT DISTINCT datname, id, name
  FROM stv_tbl_perm
  JOIN pg_database ON pg_database.oid = db_id
 ) AS t
 JOIN stv_blocklist ON tbl = t.id
 GROUP BY t.name ORDER BY gb DESC;

 -- Table column metadata
 SELECT * FROM pg_table_def
 WHERE schemaname = 'public'
 AND tablename = …;

 -- Vacuum progress
 -- see http://docs.aws.amazon.com/redshift/latest/dg/r_SVV_VACUUM_PROGRESS.html
 SELECT * FROM svv_vacuum_progress;

 -- The size in MB of each column of each table (actually the number of blocks, but blocks are 1 MB)
 -- see http://stackoverflow.com/questions/33388587/how-can-i-find-out-the-size-of-each-column-in-a-redshift-table
 SELECT
  TRIM(name) as table_name,
  TRIM(pg_attribute.attname) AS column_name,
  COUNT(1) AS size
 FROM
  svv_diskusage JOIN pg_attribute ON
    svv_diskusage.col = pg_attribute.attnum-1 AND
    svv_diskusage.tbl = pg_attribute.attrelid
 GROUP BY 1, 2
 ORDER BY 1, 2;

 -- List users and groups
 SELECT * FROM pg_user;
 SELECT * FROM pg_group;

 -- List all databases
 SELECT * FROM pg_database;

 -- List the 100 last load errors
 -- see http://docs.aws.amazon.com/redshift/latest/dg/r_STL_LOAD_ERRORS.html
 SELECT *
 FROM stl_load_errors
 ORDER BY starttime DESC
 LIMIT 100;

 -- Convert a millisecond resolution number to a TIMESTAMP
 SELECT TIMESTAMP 'epoch' + (millisecond_timestamp/1000 * INTERVAL '1 second') FROM …;

 -- Get the full SQL from a query ID
 SELECT LISTAGG(text) WITHIN GROUP (ORDER BY sequence) AS sql
 FROM STL_QUERYTEXT
 WHERE query = …;

 -- Get the full SQL, plus more query details from a query ID
 -- filter on xid to see all (including Redshift internal) operations in the transaction
 WITH query_sql AS (
  SELECT
    query,
    LISTAGG(text) WITHIN GROUP (ORDER BY sequence) AS sql
  FROM stl_querytext
  GROUP BY 1
 )
 SELECT
  q.query,
  userid,
  xid,
  pid,
  starttime,
  endtime,
  DATEDIFF(milliseconds, starttime, endtime)/1000.0 AS duration,
  TRIM(database) AS database,
  (CASE aborted WHEN 1 THEN TRUE ELSE FALSE END) AS aborted,
  sql
 FROM
  stl_query q JOIN query_sql qs ON (q.query = qs.query)
 WHERE
  q.query = …
 ORDER BY starttime;

 -- Show the most recently executed DDL statements
 SELECT
  starttime,
  xid,
  LISTAGG(text) WITHIN GROUP (ORDER BY sequence) AS sql
 FROM stl_ddltext
 GROUP BY 1, 2
 ORDER BY 1 DESC;

 -- Query duration stats including the max, median, 99 percentile, etc.
 WITH
 durations1 AS (
  SELECT
    TRIM("database") AS db,
    DATE_TRUNC('day', starttime) AS day,
    DATEDIFF(milliseconds, starttime, endtime)/1000.0 AS duration
  FROM stl_query
  WHERE label = 'default' AND querytxt LIKE 'SELECT%' AND "database" != 'dev'
 ),
 durations2 AS (
  SELECT
    db,
    day,
    duration,
    PERCENTILE_CONT(0.50) WITHIN GROUP (ORDER BY DURATION) OVER (PARTITION BY db, day) AS median,
    PERCENTILE_CONT(0.75) WITHIN GROUP (ORDER BY DURATION) OVER (PARTITION BY db, day) AS p75,
    PERCENTILE_CONT(0.90) WITHIN GROUP (ORDER BY DURATION) OVER (PARTITION BY db, day) AS p90,
    PERCENTILE_CONT(0.95) WITHIN GROUP (ORDER BY DURATION) OVER (PARTITION BY db, day) AS p95,
    PERCENTILE_CONT(0.99) WITHIN GROUP (ORDER BY DURATION) OVER (PARTITION BY db, day) AS p99,
    PERCENTILE_CONT(0.999) WITHIN GROUP (ORDER BY DURATION) OVER (PARTITION BY db, day) AS p999
  FROM durations1
 ) 
 SELECT
  db,
  day,
  MIN(duration) AS min,
  AVG(duration) AS avg,
  MAX(median) AS median,
  MAX(p75) AS p75,
  MAX(p90) AS p90,
  MAX(p95) AS p95,
  MAX(p99) AS p99,
  MAX(p999) AS p999,
  MAX(duration) AS max
 FROM durations2
 GROUP BY 1, 2
 ORDER BY 1, 2
	-- Table information like sortkeys, unsorted percentage
	-- see http://docs.aws.amazon.com/redshift/latest/dg/r_SVV_TABLE_INFO.html
	SELECT * FROM svv_table_info;

	-- Table sizes in GB
	SELECT t.name, COUNT(tbl) / 1000.0 AS gb
	FROM (
	SELECT DISTINCT datname, id, name
	FROM stv_tbl_perm
	JOIN pg_database ON pg_database.oid = db_id
	) AS t
	JOIN stv_blocklist ON tbl = t.id
	GROUP BY t.name ORDER BY gb DESC;

	-- Table column metadata
	SELECT * FROM pg_table_def
	WHERE schemaname = 'public'
	AND tablename = …;

	-- Vacuum progress
	-- see http://docs.aws.amazon.com/redshift/latest/dg/r_SVV_VACUUM_PROGRESS.html
	SELECT * FROM svv_vacuum_progress;

	-- The size in MB of each column of each table (actually the number of blocks, but blocks are 1 MB)
	-- see http://stackoverflow.com/questions/33388587/how-can-i-find-out-the-size-of-each-column-in-a-redshift-table
	SELECT
	TRIM(name) as table_name,
	TRIM(pg_attribute.attname) AS column_name,
	COUNT(1) AS size
	FROM
	svv_diskusage JOIN pg_attribute ON
	svv_diskusage.col = pg_attribute.attnum-1 AND
	svv_diskusage.tbl = pg_attribute.attrelid
	GROUP BY 1, 2
	ORDER BY 1, 2;

	-- List users and groups
	SELECT * FROM pg_user;
	SELECT * FROM pg_group;

	-- List all databases
	SELECT * FROM pg_database;

	-- List the 100 last load errors
	-- see http://docs.aws.amazon.com/redshift/latest/dg/r_STL_LOAD_ERRORS.html
	SELECT *
	FROM stl_load_errors
	ORDER BY starttime DESC
	LIMIT 100;

	-- Convert a millisecond resolution number to a TIMESTAMP
	SELECT TIMESTAMP 'epoch' + (millisecond_timestamp/1000 * INTERVAL '1 second') FROM …;

	-- Get the full SQL from a query ID
	SELECT LISTAGG(text) WITHIN GROUP (ORDER BY sequence) AS sql
	FROM STL_QUERYTEXT
	WHERE query = …;

	-- Get the full SQL, plus more query details from a query ID
	-- filter on xid to see all (including Redshift internal) operations in the transaction
	WITH query_sql AS (
	SELECT
	query,
	LISTAGG(text) WITHIN GROUP (ORDER BY sequence) AS sql
	FROM stl_querytext
	GROUP BY 1
	)
	SELECT
	q.query,
	userid,
	xid,
	pid,
	starttime,
	endtime,
	DATEDIFF(milliseconds, starttime, endtime)/1000.0 AS duration,
	TRIM(database) AS database,
	(CASE aborted WHEN 1 THEN TRUE ELSE FALSE END) AS aborted,
	sql
	FROM
	stl_query q JOIN query_sql qs ON (q.query = qs.query)
	WHERE
	q.query = …
	ORDER BY starttime;

	-- Show the most recently executed DDL statements
	SELECT
	starttime,
	xid,
	LISTAGG(text) WITHIN GROUP (ORDER BY sequence) AS sql
	FROM stl_ddltext
	GROUP BY 1, 2
	ORDER BY 1 DESC;

	-- Query duration stats including the max, median, 99 percentile, etc.
	WITH
	durations1 AS (
	SELECT
	TRIM("database") AS db,
	DATE_TRUNC('day', starttime) AS day,
	DATEDIFF(milliseconds, starttime, endtime)/1000.0 AS duration
	FROM stl_query
	WHERE label = 'default' AND querytxt LIKE 'SELECT%' AND "database" != 'dev'
	),
	durations2 AS (
	SELECT
	db,
	day,
	duration,
	PERCENTILE_CONT(0.50) WITHIN GROUP (ORDER BY DURATION) OVER (PARTITION BY db, day) AS median,
	PERCENTILE_CONT(0.75) WITHIN GROUP (ORDER BY DURATION) OVER (PARTITION BY db, day) AS p75,
	PERCENTILE_CONT(0.90) WITHIN GROUP (ORDER BY DURATION) OVER (PARTITION BY db, day) AS p90,
	PERCENTILE_CONT(0.95) WITHIN GROUP (ORDER BY DURATION) OVER (PARTITION BY db, day) AS p95,
	PERCENTILE_CONT(0.99) WITHIN GROUP (ORDER BY DURATION) OVER (PARTITION BY db, day) AS p99,
	PERCENTILE_CONT(0.999) WITHIN GROUP (ORDER BY DURATION) OVER (PARTITION BY db, day) AS p999
	FROM durations1
	)
	SELECT
	db,
	day,
	MIN(duration) AS min,
	AVG(duration) AS avg,
	MAX(median) AS median,
	MAX(p75) AS p75,
	MAX(p90) AS p90,
	MAX(p95) AS p95,
	MAX(p99) AS p99,
	MAX(p999) AS p999,
	MAX(duration) AS max
	FROM durations2
	GROUP BY 1, 2
	ORDER BY 1, 2
No results found