add new predictor updater

2025-04-09 20:11:14 +00:00 · 2021-09-13 14:42:34 +10:00 · 2021-09-13 14:42:34 +10:00 · 235e9d7e43
commit 235e9d7e43
parent 4a4f0d5402
3 changed files with 502 additions and 0 deletions
--- a/predict_updater/README.md
+++ b/predict_updater/README.md
@ -0,0 +1,23 @@
+This Lambda function will execute every minute to update the predictions in the ElasticSearch database.
+
+
+Dev notes
+--
+```
+index : predict-YYYY-MM
+fields :
+    serial
+    type
+    subtype
+
+    datetime
+    position
+    altitude
+    
+    ascent_rate
+    descent_rate
+    burst_altitude
+    descending: bool
+    landed: bool
+    data: object
+``
--- a/predict_updater/lambda_function.py
+++ b/predict_updater/lambda_function.py
@ -0,0 +1,373 @@
+import boto3
+import botocore.credentials
+from botocore.awsrequest import AWSRequest
+from botocore.endpoint import URLLib3Session
+from botocore.auth import SigV4Auth
+import json
+import os
+from datetime import datetime, timedelta, timezone
+import sys, traceback
+import http.client
+import math
+import logging
+import gzip
+from io import BytesIO
+
+HOST = os.getenv("ES")
+
+def getDensity(altitude):
+    """ 
+	Calculate the atmospheric density for a given altitude in metres.
+	This is a direct port of the oziplotter Atmosphere class
+	"""
+
+    # Constants
+    airMolWeight = 28.9644  # Molecular weight of air
+    densitySL = 1.225  # Density at sea level [kg/m3]
+    pressureSL = 101325  # Pressure at sea level [Pa]
+    temperatureSL = 288.15  # Temperature at sea level [deg K]
+    gamma = 1.4
+    gravity = 9.80665  # Acceleration of gravity [m/s2]
+    tempGrad = -0.0065  # Temperature gradient [deg K/m]
+    RGas = 8.31432  # Gas constant [kg/Mol/K]
+    R = 287.053
+    deltaTemperature = 0.0
+
+    # Lookup Tables
+    altitudes = [0, 11000, 20000, 32000, 47000, 51000, 71000, 84852]
+    pressureRels = [
+        1,
+        2.23361105092158e-1,
+        5.403295010784876e-2,
+        8.566678359291667e-3,
+        1.0945601337771144e-3,
+        6.606353132858367e-4,
+        3.904683373343926e-5,
+        3.6850095235747942e-6,
+    ]
+    temperatures = [288.15, 216.65, 216.65, 228.65, 270.65, 270.65, 214.65, 186.946]
+    tempGrads = [-6.5, 0, 1, 2.8, 0, -2.8, -2, 0]
+    gMR = gravity * airMolWeight / RGas
+
+    # Pick a region to work in
+    i = 0
+    if altitude > 0:
+        while altitude > altitudes[i + 1]:
+            i = i + 1
+
+    # Lookup based on region
+    baseTemp = temperatures[i]
+    tempGrad = tempGrads[i] / 1000.0
+    pressureRelBase = pressureRels[i]
+    deltaAltitude = altitude - altitudes[i]
+    temperature = baseTemp + tempGrad * deltaAltitude
+
+    # Calculate relative pressure
+    if math.fabs(tempGrad) < 1e-10:
+        pressureRel = pressureRelBase * math.exp(
+            -1 * gMR * deltaAltitude / 1000.0 / baseTemp
+        )
+    else:
+        pressureRel = pressureRelBase * math.pow(
+            baseTemp / temperature, gMR / tempGrad / 1000.0
+        )
+
+    # Add temperature offset
+    temperature = temperature + deltaTemperature
+
+    # Finally, work out the density...
+    speedOfSound = math.sqrt(gamma * R * temperature)
+    pressure = pressureRel * pressureSL
+    density = densitySL * pressureRel * temperatureSL / temperature
+
+    return density
+
+
+def seaLevelDescentRate(descent_rate, altitude):
+    """ Calculate the descent rate at sea level, for a given descent rate at altitude """
+
+    rho = getDensity(altitude)
+    return math.sqrt((rho / 1.225) * math.pow(descent_rate, 2))
+
+
+def predict(event, context):
+    path = "telm-*/_search"
+    payload = {
+                "aggs": {
+                    "2": {
+                    "terms": {
+                        "field": "serial.keyword",
+                        "order": {
+                        "_key": "desc"
+                        },
+                        "size": 1000
+                    },
+                    "aggs": {
+                        "3": {
+                        "date_histogram": {
+                            "field": "datetime",
+                            "fixed_interval": "5s"
+                        },
+                        "aggs": {
+                            "1": {
+                            "top_hits": {
+                                "docvalue_fields": [
+                                {
+                                    "field": "alt"
+                                }
+                                ],
+                                "_source": "alt",
+                                "size": 1,
+                                "sort": [
+                                {
+                                    "datetime": {
+                                    "order": "desc"
+                                    }
+                                }
+                                ]
+                            }
+                            },
+                            "4": {
+                            "serial_diff": {
+                                "buckets_path": "4-metric",
+                                "gap_policy": "skip",
+                                "lag": 5
+                            }
+                            },
+                            "5": {
+                            "top_hits": {
+                                "docvalue_fields": [
+                                {
+                                    "field": "position"
+                                }
+                                ],
+                                "_source": {"includes": ["position", "type", "subtype"]},
+                                "size": 1,
+                                "sort": [
+                                {
+                                    "datetime": {
+                                    "order": "desc"
+                                    }
+                                }
+                                ]
+                            }
+                            },
+                            "4-metric": {
+                            "avg": {
+                                "field": "alt"
+                            }
+                            }
+                        }
+                        }
+                    }
+                    }
+                },
+                "size": 0,
+                "stored_fields": [
+                    "*"
+                ],
+                "script_fields": {},
+                "docvalue_fields": [
+                    {
+                    "field": "@timestamp",
+                    "format": "date_time"
+                    },
+                    {
+                    "field": "datetime",
+                    "format": "date_time"
+                    },
+                    {
+                    "field": "log_date",
+                    "format": "date_time"
+                    },
+                    {
+                    "field": "time_received",
+                    "format": "date_time"
+                    },
+                    {
+                    "field": "time_server",
+                    "format": "date_time"
+                    },
+                    {
+                    "field": "time_uploaded",
+                    "format": "date_time"
+                    }
+                ],
+                "_source": {
+                    "excludes": []
+                },
+                "query": {
+                    "bool": {
+                    "must": [],
+                    "filter": [
+                        {
+                        "match_all": {}
+                        },
+                        {
+                        "range": {
+                            "datetime": {
+                                    "gte": "now-10m",
+                                    "lte": "now",
+                            "format": "strict_date_optional_time"
+                            }
+                        }
+                        }
+                    ],
+                    "should": [],
+                    "must_not": [
+                    {
+                        "match_phrase": {
+                            "software_name": "SondehubV1"
+                        }
+                    }
+                ]
+                    }
+                },
+                "size": 0
+            }
+    if "queryStringParameters" in event:
+        if "vehicles" in event["queryStringParameters"] and event["queryStringParameters"]["vehicles"] != "RS_*;*chase"  and event["queryStringParameters"]["vehicles"] != "":
+            payload["query"]["bool"]["filter"].append(
+                {
+                    "match_phrase": {
+                        "serial": str(event["queryStringParameters"]["vehicles"])
+                    }
+                }
+            )
+            payload['query']['bool']['filter'][1]['range']['datetime']['gte'] = 'now-6h' # for single sonde allow longer predictions
+    logging.debug("Start ES Request")
+    results = es_request(json.dumps(payload), path, "GET")
+    logging.debug("Finished ES Request")
+    
+
+
+    serials = { }
+    for x in results['aggregations']['2']['buckets']:
+        try:
+            serials[x['key']] = {
+                "alt": sorted(x['3']['buckets'], key=lambda k: k['key_as_string'])[-1]['1']['hits']['hits'][0]['fields']['alt'][0],
+                "position": sorted(x['3']['buckets'], key=lambda k: k['key_as_string'])[-1]['5']['hits']['hits'][0]['fields']['position'][0].split(","),
+                "rate": sorted(x['3']['buckets'], key=lambda k: k['key_as_string'])[-1]['4']['value']/25, # as we bucket for every 5 seconds with a lag of 5
+                "time": sorted(x['3']['buckets'], key=lambda k: k['key_as_string'])[-1]['key_as_string'],
+                "type": sorted(x['3']['buckets'], key=lambda k: k['key_as_string'])[-1]['5']['hits']['hits'][0]["_source"]["type"],
+                "subtype": sorted(x['3']['buckets'], key=lambda k: k['key_as_string'])[-1]['5']['hits']['hits'][0]["_source"]["subtype"]
+            }
+        except:
+            pass
+
+    conn = http.client.HTTPSConnection("tawhiri.v2.sondehub.org")
+    serial_data={}
+    logging.debug("Start Predict")
+    for serial in serials:
+
+        value = serials[serial]
+        ascent_rate=value['rate'] if value['rate'] > 0.5 else 5 # this shouldn't really be used but it makes the API happy
+        descent_rate= seaLevelDescentRate(abs(value['rate']),value['alt']) if value['rate'] < 0 else 6
+        if descent_rate < 0.5:
+            continue
+        if value['rate'] < 0:
+            burst_altitude = value['alt']+0.05
+        else:
+            burst_altitude = (value['alt']+0.05) if value['alt'] > 26000 else 26000
+
+        longitude = float(value['position'][1].strip())
+        if longitude < 0:
+            longitude += 360
+        url = f"/api/v1/?launch_latitude={value['position'][0].strip()}&launch_longitude={longitude}&launch_datetime={value['time']}&launch_altitude={value['alt']:.2f}&ascent_rate={ascent_rate:.2f}&burst_altitude={burst_altitude:.2f}&descent_rate={descent_rate:.2f}"
+        
+
+        conn.request("GET", url
+            
+        )
+        res = conn.getresponse()
+        data = res.read()
+        if res.code != 200:
+            logging.debug(data)
+        serial_data[serial] = json.loads(data.decode("utf-8"))
+    logging.debug("Stop Predict")
+    output = []
+    for serial in serial_data:
+        value = serial_data[serial]
+
+        
+        data = []
+        if 'prediction' in value:
+            for stage in value['prediction']:
+                if stage['stage'] == 'ascent' and serials[serial]['rate'] < 0: # ignore ascent stage if we have already burst
+                    continue
+                else:
+                    for item in stage['trajectory']:
+                        data.append({
+                            "time": int(datetime.fromisoformat(item['datetime'].split(".")[0].replace("Z","")).timestamp()),
+                            "lat": item['latitude'],
+                            "lon": item['longitude'] - 360 if item['longitude'] > 180 else item['longitude'],
+                            "alt": item['altitude'],
+                        })
+            output.append(
+                {
+                    "serial": serial,
+                    "type": serials[serial]['type'],
+                    "subtype": serials[serial]['subtype'],
+                    "datetime": value['request']['launch_datetime'],
+                    "position": [
+                        value['request']['launch_latitude'],
+                        value['request']['launch_longitude'] - 360 if value['request']['launch_longitude'] > 180 else value['request']['launch_longitude']
+                        ],
+                    "altitude": value['request']['launch_altitude'],
+                    "ascent_rate": value['request']['ascent_rate'],
+                    "descent_rate": value['request']['descent_rate'],
+                    "burst_altitude": value['request']['burst_altitude'],
+                    "descending": True if serials[serial]['rate'] < 0 else False,
+                    "landed": False, # I don't think this gets used anywhere?
+                    "data": data
+                }
+            )
+
+    # ES bulk update
+    body=""
+    for payload in output:
+        body += "{\"index\":{}}\n" + json.dumps(payload) + "\n"
+    body += "\n"
+    index = datetime.now().strftime("%Y-%m")
+    result = es_request(body, f"predictions-{index}/_doc/_bulk", "POST")
+    if 'errors' in result and result['errors'] == True:
+        error_types = [x['index']['error']['type'] for x in result['items'] if 'error' in x['index']] # get all the error types
+        error_types = [a for a in error_types if a != 'mapper_parsing_exception'] # filter out mapper failures since they will never succeed
+        if error_types:
+            print(event)
+            print(result)
+            raise RuntimeError
+    
+    logging.debug("Finished")
+    return
+
+def es_request(params, path, method):
+    # get aws creds
+    session = boto3.Session()
+    
+    compressed = BytesIO()
+    with gzip.GzipFile(fileobj=compressed, mode='w') as f:
+        f.write(params.encode('utf-8'))
+    params = compressed.getvalue()
+
+
+    headers = {"Host": HOST, "Content-Type": "application/json", "Content-Encoding":"gzip"}
+    request = AWSRequest(
+        method=method, url=f"https://{HOST}/{path}", data=params, headers=headers
+    )
+    SigV4Auth(boto3.Session().get_credentials(), "es", "us-east-1").add_auth(request)
+
+    session = URLLib3Session()
+    r = session.send(request.prepare())
+
+    if r.status_code != 200:
+        raise RuntimeError
+    return json.loads(r.text)
+
+
+if __name__ == "__main__":
+    print(predict(
+          {},{}
+        ))
+    
+
--- a/predictor.tf
+++ b/predictor.tf
@ -0,0 +1,106 @@
+data "archive_file" "predict_updater" {
+  type        = "zip"
+  source_file = "predict_updater/lambda_function.py"
+  output_path = "${path.module}/build/predict_updater.zip"
+}
+
+resource "aws_iam_role" "predict_updater" {
+  path                 = "/service-role/"
+  name                 = "predict-updater"
+  assume_role_policy   = <<EOF
+{
+    "Version": "2012-10-17",
+    "Statement": [{
+        "Effect": "Allow",
+        "Principal": {
+            "Service": "lambda.amazonaws.com"
+        },
+        "Action": "sts:AssumeRole"
+    }]
+}
+EOF
+  max_session_duration = 3600
+}
+
+
+resource "aws_iam_role_policy" "predict_updater" {
+  name   = "predict_updater"
+  role   = aws_iam_role.predict_updater.name
+  policy = <<EOF
+{
+    "Version": "2012-10-17",
+    "Statement": [
+        {
+            "Effect": "Allow",
+            "Action": "logs:CreateLogGroup",
+            "Resource": "arn:aws:logs:us-east-1:${data.aws_caller_identity.current.account_id}:*"
+        },
+        {
+            "Effect": "Allow",
+            "Action": [
+                "logs:CreateLogStream",
+                "logs:PutLogEvents"
+            ],
+            "Resource": [
+                "arn:aws:logs:us-east-1:${data.aws_caller_identity.current.account_id}:log-group:/aws/lambda/*"
+            ]
+        },
+        {
+            "Effect": "Allow",
+            "Action": "es:*",
+            "Resource": "*"
+        },
+        {
+            "Effect": "Allow",
+            "Action": "sqs:*",
+            "Resource": "*"
+        },
+        {
+            "Effect": "Allow",
+            "Action": "s3:*",
+            "Resource": "*"
+        }
+    ]
+}
+EOF
+}
+
+
+resource "aws_lambda_function" "predict_updater" {
+  function_name                  = "predict_updater"
+  handler                        = "lambda_function.predict"
+  filename                       = "${path.module}/build/predict_updater.zip"
+  source_code_hash               = data.archive_file.predict_updater.output_base64sha256
+  publish                        = true
+  memory_size                    = 256
+  role                           = aws_iam_role.predict_updater.arn
+  runtime                        = "python3.8"
+  timeout                        = 60
+  reserved_concurrent_executions = 8
+  environment {
+    variables = {
+      "ES" = aws_route53_record.Route53RecordSet7.fqdn
+    }
+  }
+}
+
+
+resource "aws_cloudwatch_event_rule" "predict_updater" {
+  name        = "predict_updater"
+  description = "predict_updater"
+
+  schedule_expression = "rate(1 minute)"
+}
+
+resource "aws_cloudwatch_event_target" "predict_updater" {
+  rule      = aws_cloudwatch_event_rule.predict_updater.name
+  target_id = "SendToLambda"
+  arn       = aws_lambda_function.predict_updater.arn
+}
+
+resource "aws_lambda_permission" "predict_updater" {
+  action        = "lambda:InvokeFunction"
+  function_name = aws_lambda_function.predict_updater.function_name
+  principal     = "events.amazonaws.com"
+  source_arn    = aws_cloudwatch_event_rule.predict_updater.arn
+}