Mehr

Räumliche Interpolation von 30 Wetterstationen auf andere Gebiete


Ich habe monatliche (und manchmal tägliche) Temperaturdaten von etwa 30 schwedischen Wetterstationen Mitte des 19. Jahrhunderts, die ich auf das ganze Land interpolieren möchte. Ich verwende ArcGIS und Stata.

Für spätere Jahre habe ich Daten zu zusätzlichen Wetterstationen (ca. 100), daher habe ich daran gedacht, die späteren Daten zu verwenden, um ein Modell mit den alten Stationen zu kalibrieren, um das Wetter an den neuen Stationen vorherzusagen. Da ich das aktuelle Wetter an den neuen Stationen kenne, konnte ich mich auf das Modell kalibrieren, um die bestmögliche Anpassung zu erreichen. Aber ich bin mir nicht sicher, was eine gute Methode ist, um eine geeignete Passform zu erreichen (ich möchte zum Beispiel keine Überanpassung riskieren).


Sie können wahrscheinlich eine vernünftige Interpolation erhalten, indem Sie eine lineare Regression verwenden (vorausgesetzt, Ihre 30 Wetterstationen sind eine repräsentative Stichprobe), wobei Höhe, Breite und Entfernung von der Küste als unabhängige Variablen mit dem Tag als Faktor verwendet werden. Ich habe dies zuvor mit ArcGIS und R getan.

Tägliche Temperaturen um 9 Uhr und 15 Uhr über 10 Tage im Jahr 2003 von Wetterstationen in Südostaustralien

Grundlagen:

  • Holen Sie sich ein digitales Höhenmodell Ihrer Region.
  • Holen Sie sich eine Vektor- oder Rasterküstenlinie
  • Breitengrad-Raster generieren (Beispiel)
  • Ein Entfernungs-Raster aus der Küste generieren (vielleicht mit euklidischer Entfernung)
  • Verwenden Sie für die Variablen, für die Sie keine Daten für jede Station haben, das Werkzeug "Werte in Punkte erfassen" oder "Werte in Punkte extrahieren", um das entsprechende Raster abzufragen. Ich musste dies nur für die Entfernung von der Küste tun, da meine Wetterstationsdaten Länge, Breite und Höhe enthielten.
  • Stecken Sie Höhe, Breite und Distanz als unabhängige Variablen, Temperatur als abhängige Variable und Tag als Faktor in ein lineares Regressionsmodell in r/spss/stata/etc…
  • Wenn Sie eine anständige Anpassung erhalten, verwenden Sie die Modellkoeffizienten, um einen Rasterrechnerausdruck (Temperatur = α + βelev*höhe + βlat*lat + βdist*dist), um die Temperatur aus Höhe, Breite und Entfernung abzuschätzen. Möglicherweise müssen Sie dies skripten, da Sie für jeden Tag unterschiedliche Koeffizienten erhalten.

In diesem Artikel wird die Leistung von sechs verschiedenen Interpolationsmethoden auf Basis des geografischen Informationssystems bewertet: inverse Distanzgewichtung (IDW), radiale Basisfunktion (RBF), globale polynomielle Interpolation, lokale polynomielle Interpolation, Kriging und Cokriging unter Verwendung der zwischen 1987 entwickelten Ohio-Home-Datenbank und 2011. Die beste Interpolationsmethode für die Vorhersage von Radongaskonzentrationen in den nicht gemessenen Gebieten von Ohio, USA, wurde durch die Validierung der Modellvorhersagen mit Betriebsleistungskennzahlen bestimmt. Darüber hinaus führte diese Studie eine auf Postleitzahlenebene basierende Analyse durch, die ein vollständiges Bild der Verteilung der Radonkonzentration in Ohio lieferte

Die RBF-Methode wurde als die beste Methode identifiziert. Das RBF-Verfahren schnitt zwar deutlich besser ab als das IDW, war aber den anderen Interpolationsverfahren statistisch ähnlich. Die vom RBF prognostizierten Ergebnisse der Radongaskonzentration zeigten einen signifikanten Anstieg der Zahl der Postleitzahlen, die die Aktionsgrenzen der US-Umweltschutzbehörde und der Weltgesundheitsorganisation überschritten haben, was die Notwendigkeit anzeigt, die Radongaskonzentration in Ohio auf ein sicheres Niveau zu senken die gesundheitlichen Auswirkungen zu reduzieren. Der in diesem Papier gezeigte Ansatz kann auf andere von Radon betroffene Gebiete auf der ganzen Welt angewendet werden.


Vergleich räumlicher Interpolationsmethoden zur Schätzung der Niederschlagsverteilung im Distrito Federal, Brasilien

Die verfügbaren klimatologischen Informationen des Distrito Federal genügen nicht den Anforderungen an eine detaillierte Klimadiagnose, da sie nicht die erforderliche räumliche Auflösung für Wasserressourcenmanagementzwecke bieten. Anhand der Jahres- und Jahreszeitenklimatologie (1971–2000) der Niederschläge von 6 meteorologischen Stationen und 54 Niederschlagsmessern aus Zentralbrasilien wurden acht verschiedene räumliche Interpolationsverfahren getestet. Geografische Faktoren (d. h. Höhe, Länge und Breite) erklären einen Großteil der Niederschläge in der Region, daher wurden multivariate Modelle einbezogen. Die Leistung der Schätzungen wurde durch unabhängige Validierung unter Verwendung des mittleren quadratischen Fehlers, des Korrelationskoeffizienten und des Nash-Sutcliffe-Effizienzkriteriums bewertet. Inverse Distance Weighting (IDW), normales Kriging (OK) und die multivariate Regression mit Interpolation der Residuen von IDW (MRegIDW) und OK (MRegOK) haben die geringsten Fehler und die höchste Korrelation und das Nash-Sutcliffe-Effizienzkriterium erbracht. Im Allgemeinen liefern Interpolationsmethoden ähnliche räumliche Niederschlagsverteilungen überall dort, wo das Beobachtungsnetz dicht ist. Die Einbeziehung geografischer Variablen in die Interpolationsmethode sollte jedoch die Schätzungen in Gebieten verbessern, in denen die Dichte des Beobachtungsnetzes gering ist. Dennoch liefert die Bewertung der Unsicherheiten mit einem geostatistischen Verfahren ergänzende und qualitative Informationen, die bei der Interpretation der räumlichen Niederschlagsverteilung berücksichtigt werden sollten.

Dies ist eine Vorschau von Abonnementinhalten, auf die Sie über Ihre Institution zugreifen können.


2. USGS-Peak-Flow-Aufzeichnungen

[3] Um die räumliche Verteilung großer US-Überschwemmungen zu charakterisieren, haben wir die Peak Flow-Dateien aus Aufzeichnungen von USGS-Strommessstationen abgeleitet und als Teil des USGS National Water Information System [ Lepkin und DeLapp, 1979 ] (Daten sind verfügbar unter http://waterdata.usgs.gov/usa/nwis/nwis). Die Peak-Flow-Datei für jede Station enthält Werte für den größten momentanen Abfluss (Peak-Flow) für jedes Wasserjahr (1. Oktober bis 30. September) des Stationsbetriebs sowie Hinweise zu Faktoren, die den Abfluss und die Qualität der Abflussaufzeichnungen beeinflussen. Für Aufzeichnungen, die bis zum Wasserjahr 1997 (Ende 30. September 1997) erstellt wurden, werden jährliche Spitzenabflüsse für 23.216 aktuelle und ehemalige Stationen gemeldet, die zusammen mehr als 0,5 Millionen jährliche Spitzenabflusswerte umfassen.

2.1. Größte meteorologische Überschwemmungen aus Becken zwischen 2,6 und 26.000 km 2

[4] Aus den Peak-Flow-Dateien von Bachmessstationen mit Einzugsgebieten zwischen 2,6 und 26.000 km 2 (1 bis 10.000 mi 2 ) und mit einer Aufzeichnung von 5 oder mehr Jahren haben wir die oberen 10 % der jährlichen Spitzenabflüsse extrahiert. Die resultierende Datenbank bestand aus 43.645 Jahresspitzenabflüssen von 18.735 Stationen. Jede Station hat je nach Aufzeichnungsdauer 1 bis 15 Jahresspitzenabflüsse pro Station. Aus diesen Daten haben wir fast 8000 (ca. 19 %) der jährlichen Spitzenabflüsse abgelehnt, die in den Spitzenabflussdateien als geschätzt, beeinflusst durch Dammversagen oder beeinflusst durch Regulierung, Umleitung, Urbanisierung, Bergbau, landwirtschaftliche Veränderungen oder Kanalisierung kodiert wurden. . Die resultierende Datenbank besteht aus 35.663 jährlichen Spitzenabflüssen von 14.815 Strommessstationen in den Vereinigten Staaten und Puerto Rico (Abbildung 1).

[5] Indem wir uns auf Einzugsgebiete zwischen 2,6 und 26.000 km 2 konzentrieren und Datensätze ausschließen, die als von anthropogenen Faktoren wie Regulierung oder Umleitung beeinflusst codiert wurden, haben wir wahrscheinlich den Einfluss dieser Faktoren auf die verbleibenden jährlichen Spitzenabflüsse reduziert. Die Überprüfung der aufbewahrten Aufzeichnungen zeigt jedoch, dass viele der analysierten jährlichen Spitzenabflüsse tatsächlich bis zu einem gewissen Grad von Regulierung, Umleitung und Urbanisierung betroffen waren. Zusammenfassend lässt sich sagen, dass uneinheitliche Kodierungspraktiken im Laufe der Zeit und bei den verschiedenen Stellen, die diese Daten melden, es schwierig machen, die von solchen Faktoren betroffenen Jahresspitzenströme allein auf der Grundlage der Informationen in den Spitzenstromdateien vollständig zu isolieren.

[6] Auch andere Aspekte der Daten in ihrer jetzigen Form erschweren eine unverzerrte quantitative Bewertung der räumlichen Verteilung großer Ströme. Während USGS-Messstationen den Durchfluss aus den Becken in jedem Bundesstaat und in Puerto Rico messen, ist die Abdeckung nicht einheitlich, wobei die Stationsdichte teilweise der Bevölkerungsdichte entspricht, was an der großen Anzahl von Stationen entlang der Ostküste und anderen städtischen Gebieten ersichtlich ist (Abbildung 1). Darüber hinaus haben viele in die Analyse einbezogene Einzugsgebiete mehrere Stationen mit überlappenden Beitragsbereichen, wie es bei einer Reihe von Stationen entlang eines einzelnen Flusses üblich ist. In diesen Situationen sind die Aufzeichnungen der jährlichen Spitzenabflüsse für diese Stationen möglicherweise nicht unabhängig, da das gleiche Hochwasser an mehreren Standorten gemessen (und in die Spitzenabflussdateien aufgenommen) werden kann. Dieser Faktor wird reduziert, aber nicht eliminiert, indem Einzugsgebiete von mehr als 26.000 km 2 ausgeschlossen werden. Die große Anzahl und weite Verteilung der Stationen überlagert jedoch vermutlich die in der Datenbank hinterlegten anthropogenen Faktoren, die die räumliche Verteilung von großen Spitzenabflüssen zumindest für die qualitative Bewertung der räumlichen Verteilung großer Abflüsse systematisch beeinflussen können.

[7] Aus den letzten aufgezeichneten Aufzeichnungen von 35.663 jährlichen Spitzenabflüssen von 14.815 Messstationen zeigt ein Diagramm des Spitzenabflusses gegenüber dem Einzugsgebiet erwartungsgemäß, dass größere Einzugsgebiete typischerweise größere Spitzenabflüsse aufweisen (Abbildung 2). Dennoch erzeugen einige Becken größere Ströme als andere Becken ähnlicher Größe. Um die größten dieser maximalen jährlichen Abflüsse in Bezug auf das Einzugsgebiet zu unterscheiden, haben wir die Daten von Abbildung 2 weiter in die ∼90 (Tabelle 1) formuliert, um eine ähnliche Gesamtverteilung der Einzugsgebiete im Verhältnis zur Gesamtpopulation der analysierten Stationen aufrechtzuerhalten (Abbildung 3). Obwohl wir diese Teilmengen hoher Einheitsabflüsse als ∼90. und ∼99. Perzentil bezeichnen, handelt es sich im Wesentlichen um ∼99. und ∼99,9 alle Jahresspitzenabflüsse für jede Station.

Schichtung Gleichung Anzahl der Überschwemmungen Anzahl der Stream-Gaging-Stationen
∼90. Perzentil Qpk90 = 24,3 [km²] 0,57 3503 2088
∼99. Perzentil Qpk99 = 74 [km²] 0,53 397 284

2.2. Abgrenzung des Entwässerungsbeckens

[8] Die 3503 Flüsse, die die ∼90. Perzentil-Einheitsentladungen bilden, stammen von 2.088 (von den 14.815) USGS-Strommessstationen in den Vereinigten Staaten und Puerto Rico. Für jede dieser 2.088 Stationen wurden dazu beitragende Einzugsgebiete innerhalb eines geografischen Informationssystems (GIS) unter Verwendung eines digitalen Höhenmodells mit einer Auflösung von 1 km für Nordamerika (HYDRO1k-Höhendaten von http://edcdaac.usgs.gov/gtopo30) abgegrenzt /Hydro). Die grobe Auflösung des Höhenmodells erschwert quantitative GIS-Analysen, die Fließeigenschaften mit räumlichen Daten in Beziehung setzen. Dennoch ermöglichen diese ungefähren Abgrenzungen die Darstellung der räumlichen Verteilung der Gebiete mit den größten Einheitsabflüssen auf nationaler Basis und nicht nur der Punktpositionen der Bachmessstationen.


3. Ergebnisse und Diskussion

3.1. Geländeanalysen

[15] Die mittlere Höhe innerhalb der 50-km-Puffer, die die Wetterstationen umgeben, reichten von 1037 m bis 5040 m, wobei die Mehrheit über 3000 m lag (Abbildung 3a). Im Vergleich mit der Höhe jeder Station zeigte die mittlere Höhe innerhalb der 50-km-Puffer deutlich die Auswirkungen der Glättung aufgrund der räumlichen Auflösung der DEM-Daten von 1 km und der Mittelwertbildung innerhalb der Puffer (Abbildung 4). Der mittlere Neigungsgradient innerhalb der 50 km langen Puffer reichte von 0,4 bis 13,7 Grad (Abbildung 3b), während die maximale Neigung zwischen 1,9 und 45,9 Grad variierte. Abbildung 5 zeigt das räumliche Verteilungsmuster der Hangaspekte. Der Anteil der flachen Pisten wurde nicht dargestellt, da er tendenziell sehr klein war und von 0 bis 0,052 reichte, für eine Station bei 0,234.

3.2. Verzerrung der SSM/I-Schätzungen

[16] Abbildung 6 zeigt die mittlere Abweichung der SSM/I-Schätzungen als das Verhältnis der SSM/I-Schätzungen zu den an der Station beobachteten Niederschlägen für den Durchschnitt aller Monate. Die Verzerrungen wurden mit allen Jahren berechnet, wobei die verfügbaren Daten für einen bestimmten Monat oder eine bestimmte Saison zusammengefasst wurden. Bei den meisten Stationen im Untersuchungsgebiet lagen die Verzerrungen unter Eins (oder wurden unterschätzt). Orte mit deutlicher Überschätzung durch die SSM/I wurden hauptsächlich im nördlichen Teil des tibetischen Plateaus gefunden. Während die meisten früheren Vergleichs- und Validierungsstudien eine Überschätzung durch SSM/I-basierte Niederschlagsraten nahelegten, hat der NESDIS-Algorithmus eine signifikante regionale Variation der Verzerrungen und in einigen Fällen eine signifikante Unterschätzung in Regionen höherer Breiten gezeigt [ Ebertet al., 1996 Ebert und Manton, 1998 Adleret al., 2001 Kummerowet al., 2001 McCollumet al., 2000 , 2002 ]. Diese Studien zeigten auch starke räumliche und zeitliche Variationen, die weitere Untersuchungen unter unterschiedlichen regionalen Bedingungen erfordern.

[17] Es gibt mehrere mögliche Gründe für die über dem tibetischen Plateau gefundenen prominenten negativen Vorurteile. Ein globaler Zonenvergleich von comparison Ferraroet al. [1996] zwischen SSM/I und der Eichanalyse von Legaten und Willmott [1990] schlugen vor, dass SSM/I die Niederschläge in mittleren bis hohen Breiten aufgrund des Ausschlusses von Ereignissen, in denen Schnee und Eis vorhanden waren, unterschätzt, aber die Niederschläge in tropischen Regionen überschätzt. Der NESDIS-Algorithmus basiert auf der Detektion der Streuung in der Regenschicht der Atmosphäre. Die atmosphärische Mächtigkeit über dem tibetischen Plateau ist jedoch ein Aspekt, der in den früheren Validierungsstudien, die auf oder nahe dem Meeresspiegel durchgeführt wurden, nicht dargestellt wurde. Eine geringere Luftdichte und eine relativ kalte und karge Plateauoberfläche aufgrund der großen Höhe können zu geringeren Unterschieden in den Streusignalen zwischen der Plateauoberfläche und der Plateauatmosphäre führen. Daher können Algorithmen, die unter Verwendung von Daten für Gebiete in niedriger Höhe entwickelt wurden, zu falschen Schätzungen führen. Ebert und Manton [1998] stellten fest, dass SSM/I zwar gut darin ist, räumliche Muster von Niederschlagsereignissen abzugrenzen, aber das Niederschlagsregime ist eindeutig ein Faktor, der die Genauigkeit der Schätzungen beeinflusst. Ferraro und Marks [1995] wies darauf hin, dass die minimale nachweisbare Regenrate durch den NESDIS-Algorithmus 0,5 mm/h beträgt, was dazu führen kann, dass einige leichte Regenereignisse, die auf dem tibetischen Plateau üblich sind, übersehen werden. Greeneet al. [1997] schlugen auch vor, dass die Verzerrungen der SSM/I-Schätzungen von den Eigenschaften der Niederschlagsereignisse abhängen könnten.

[18] Die Ergebnisse der bivariaten Regression zwischen Satellitenschätzungen und oberflächenbeobachteten Niederschlägen sind in Abbildung 7 dargestellt Ja Achse und die Regressionskoeffizienten (Steigungen) zeigten signifikante saisonale Muster. Während des gesamten Untersuchungszeitraums (1987–1999) variierte die Anzahl der in Betrieb befindlichen Satelliten, was eine weitere Variationsdimension in den SSM/I-Schätzungen hinzufügte. In Zeiten, in denen nur ein Satellit verfügbar ist, kann eine Szene höchstens zweimal täglich besucht werden. Morrissey und Wang [1994] wies darauf hin, dass solche Probenahmebeschränkungen über tropischen Ozeanen mit signifikanten täglichen Bewölkungs- und Niederschlagszyklen zu einer Unterschätzung führen können. Ähnliche Argumente können auch für das tibetische Plateau angeführt werden, wo während der Monsunzeit das tägliche Niederschlagsmuster gut bekannt ist [ Kuwagataet al., 2001 Liuet al., 2002]. In Bezug auf die Stärke der Beziehungen zwischen den SSM/I-Schätzungen und den beobachteten Stationswerten, R 2 Werte für die bivariaten Regressionsmodelle stimmen in etwa mit früheren Studien überein (Tabelle 3). Beispielsweise, Xie und Arkin [1995] verglichen die SSM/I-basierten Schätzungen mit den GPCC- und CAMS-Stationsdaten für 2,5° × 2,5° Gitterzellen. Die Korrelationen zwischen den monatlichen SSM/I-Schätzungen basierend auf dem Grody-Algorithmus und den Stationsdaten in den Zonen 20°–40° N und 20°–40° S betrugen 0,56 für das CAMS und 0,61 für die GPCC-Datensätze. Sie verwendeten auch die CAMS-Stationen über China und leiteten einen Korrelationskoeffizienten von 0,685 für den 3-jährigen Untersuchungszeitraum ab. Niedrig R 2 Werte für die Wintermonate (Tabelle 3) waren wahrscheinlich auf die Behandlung von Schnee-/Eisoberflächen durch den NESDIS-Algorithmus zurückzuführen. Wir untersuchten die SSM/I-basierten monatlichen Schneebedeckungsdaten des NESDIS (ftp://orbit35i.nesdis.noaa.gov/pub/arad/ht/rferraro/ncdc/). Dieser Datensatz enthält monatliche mittlere Schneebedeckungsanteile (0–1,0) für die 1° × 1°-Raster. Während der Wintermonate (DJF) war der Großteil des tibetischen Plateaus von Schnee bedeckt, im Vergleich zu allen anderen Monaten, in denen nur ein kleiner Teil hohe Anteile an Schnee hatte (Abbildung 8).

Modell Abfangen SSM/I-Schätzungen Steigung Standardisierter Koeffizient t Bedeutung R 2
JAN 3.354 JAN_EST 3.680 0.698 9.594 0.0000 0.487
Februar 6.572 FEB_EST 2.067 0.416 4.510 0.0000 0.173
BESCHÄDIGEN 10.672 MAR_EST 4.275 0.790 12.685 0.0000 0.624
APR 14.902 APR_EST 1.179 0.575 6.918 0.0000 0.330
KANN 31.144 MAY_EST 0.624 0.658 8.610 0.0000 0.433
Juni 45.632 JUN_EST 0.507 0.702 9.704 0.0000 0.493
JUL 50.253 JUL_EST 0.580 0.676 9.035 0.0000 0.457
AUG 60.870 AUG_EST 0.620 0.440 4.828 0.0000 0.194
SEP 43.640 SEP_EST 0.758 0.631 8.009 0.0000 0.398
OKT 20.561 OCT_EST 1.546 0.498 5.663 0.0000 0.248
November 4.992 NOV_EST 1.813 0.403 4.333 0.0000 0.162
DEZ 2.634 DEC_EST 0.867 0.074 0.732 0.4660 0.005
WINTER 11.105 WIN_EST 4.296 0.630 7.995 0.0000 0.397
FRÜHLING 47.556 SPR_EST 1.137 0.734 10.660 0.0000 0.539
SOMMER 155.596 SUM_EST 0.575 0.646 8.330 0.0000 0.417
FALLEN 55.380 FAL_EST 1.216 0.708 9.865 0.0000 0.501
MONSUN 218.617 MONS_EST 0.648 0.681 9.170 0.0000 0.464
JÄHRLICH 20.644 ANN_EST 0.839 0.708 9.883 0.0000 0.502

[19] Schließlich verwendeten einige der Validierungsstudien Radar-Niederschlagsdaten, die in der Regel bessere regionale Schätzungen lieferten als herkömmliche Pegeldaten. Tatsächlich wurde der NESDIS-Algorithmus mit Radardaten der Regenraten abgestimmt. Im Allgemeinen unterschätzen Punktniederschlagsmessungen die regionale Niederschlagsmenge [ US-Wetteramt, 1957 ]. Anagnostouet al. [1999] wies darauf hin, dass die Flächen-Punkt-Differenz bis zu 60 % der Varianz bei Radarmessgeräte-Vergleichen ausmachte. Da die 1° × 1° gerasterten SSM/I-Schätzungen durch Interpolation herunterskaliert und innerhalb der 50-km-Puffer gemittelt wurden, können Zellen mit hohem Niederschlag mit den Auswirkungen von Zellen mit geringerem oder keinem Niederschlag kombiniert werden. Dieses Verfahren könnte die Diskrepanz zwischen dem Stationsniederschlag und den SSM/I-Schätzungen innerhalb der 50-km-Puffer weiter vergrößert haben. In Anbetracht der Tatsache, dass die in dieser Studie verwendeten Niederschlagsdaten der Stationen nicht um die Auswirkungen von Wind und Schnee korrigiert wurden, war die Unterschätzung signifikanter, als es den Anschein hatte. In den kälteren Monaten kann der korrigierte Niederschlag das 1,5- bis 2,0-fache der gemessenen Niederschlagswerte über dem tibetischen Plateau betragen [ Ueno und Ohata, 1996]. Die Ergebnisse der Bias-Analyse weisen eindeutig auf die Notwendigkeit regionalisierter Algorithmen hin, die auf lokalen und regionalen Merkmalen basieren, um genaue Niederschlagsschätzungen zu erhalten.

3.3. Räumliche Modellierung basierend auf multipler Regression

[20] Die schrittweise Regression wurde verwendet, um unabhängige Variablen auszuwählen, die signifikante Beiträge zur Erklärung der Variationen des Stationsniederschlags leisten. Aufgrund der Kollinearität zwischen den unabhängigen Variablen gingen bestimmte Geländevariablen nicht in die endgültigen Modelle ein, da ihre Auswirkungen durch andere verwandte Variablen dargestellt wurden. Die Ergebnisse der Regressionsanalyse zeigen, dass die ursprünglichen SSM/I-Schätzungen eine geringe Erklärungskraft der räumlichen Struktur des Niederschlags über dem tibetischen Plateau hatten, insbesondere für Monate mit ausgedehnter Schneedecke, und dass Gelände- und Standortvariablen einen signifikanten Einfluss auf die Genauigkeit der Satellitenschätzungen hatten. Bei der Verwendung von Satellitenschätzungen zur Vorhersage von Bodenbeobachtungen ohne die in dieser Studie untersuchten Gelände- und Standortvariablen, R 2 Werte reichten von 0,005 (Dezember) bis 0,624 (März), mit einem Mittelwert von 0,334 für alle Monate (Tabelle 3). Als die Gelände- und Standortvariablen zum Regressionsprozess hinzugefügt wurden, wurde die R 2 Werte verbesserten sich auf einen Bereich von 0,217 (Dezember) bis 0,739 (März) mit einem Mittelwert von 0,590 (Tabelle 4). Die Saison- und Jahresmodelle waren im Allgemeinen besser als die Monatsmodelle, mit einem Mittelwert R 2 von 0,470, bevor die Gelände- und Standortvariablen hinzugefügt wurden, und 0,675 nach ihrer Aufnahme.

Modellzusammenfassung Nur mit Satellitenschätzungen Mit Gelände-Standort-Variablen Variablen, die in die Modelle eingegeben wurden (entsprechend der Reihenfolge der Eingabe)
R 2 Adj. R 2 Std. Error R 2 Adj. R 2 Std. Error
JAN 0.487 0.482 4.6 0.602 0.577 4.1 JAN_EST, SE, MIN_H, MAX_H, MEAN_SLP, W
Februar 0.173 0.165 10.8 0.412 0.380 9.3 FEB_EST, MIN_H, LAT, MAX_SLP, N
BESCHÄDIGEN 0.624 0.620 13.6 0.739 0.728 11.5 MAR_EST, LANG, LAT, NW
APR 0.330 0.323 19.1 0.576 0.558 15.4 APR_EST, MIN_H, LANG, LAT
KANN 0.433 0.427 23.5 0.691 0.674 17.7 MAI_EST, LANG, SE, S, SW
Juni 0.493 0.487 31.0 0.681 0.664 25.1 JUN_EST, LONG, SE, MEAN_SLP, STD_H
JUL 0.457 0.451 39.3 0.668 0.646 31.6 JUL_EST, SE, MAX_H, LAT, LONG, E
AUG b b AUG_EST (Satellitenschätzungen) ging nicht in das Modell ein, obwohl es mit AUG bei der Signifikanz von 0,05 korreliert.
0.194 0.185 50.3 0.617 0.596 35.4 LAT, MAX_H, N, W, NE
SEP 0.398 0.392 31.2 0.704 0.685 22.5 SEP_EST, LAT, LONG, STD_H, MEAN_SLP, SE
OCT c c OCT_EST hat das Modell nicht zuerst eingegeben.
0.248 0.241 20.4 0.615 0.594 14.9 LONG, LAT, MIN_H, OCT_EST, SE
NOV d d NOV_EST wurde nicht zuerst eingegeben.
0.162 0.154 6.4 0.558 0.534 4.8 LAT, LONG, NOV_EST, MEAN_H, MAX_H
DEC e e DEC_EST ist mit 0,05 statistisch nicht signifikant.
0.005 0.000 4.9 0.217 0.192 4.4 STD_H, SE, MEAN_SLP
WINTER 0.397 0.391 16.5 0.476 0.459 15.6 WIN_EST, SE, MIN_H
FRÜHLING 0.539 0.535 45.9 0.700 0.684 37.8 SPR_EST, LONG, LAT, MIN_H, SE
SUMMER f f SUM_EST wurde zuerst eingegeben, wurde jedoch in Schritt 5 eliminiert und dann in Schritt 9 erneut eingegeben.
0.417 0.411 103.9 0.711 0.686 75.9 SE, LAT, LONG, MAX_H, SW, W, SUM_EST, NW
FALLEN 0.501 0.496 45.2 0.711 0.699 34.9 FAL_EST, SE, LONG, LAT
MONSOON g g MONSOON_EST wurde in Schritt 8 mit R 2 = 0,737 eliminiert.
0.464 0.459 143.9 0.732 0.714 104.6 SE, LONG, LAT, STD_H, MAX_H, MEAN_SLP
JÄHRLICH 0.502 0.497 15.3 0.722 0.707 11.7 ANN_EST, SE, LANG, LAT, MAX_H
  • a Die angepasste R 2 Werte (Adj. R 2) spiegeln den Einfluss der Kollinearität zwischen den unabhängigen Variablen wider. Der Standardfehler von Schätzungen (Std. Error) ist ein weiteres Maß für die Modellleistung.
  • b AUG_EST (Satellitenschätzungen) ging nicht in das Modell ein, obwohl es mit AUG bei der Signifikanz von 0,05 korreliert ist.
  • c OCT_EST hat das Modell nicht zuerst eingegeben.
  • d NOV_EST wurde nicht zuerst eingegeben.
  • e DEC_EST ist mit 0,05 statistisch nicht signifikant.
  • f SUM_EST wurde zuerst eingegeben, wurde jedoch in Schritt 5 eliminiert und dann in Schritt 9 erneut eingegeben.
  • g MONSOON_EST wurde in Schritt 8 mit R 2 = 0.737 eliminiert.

[21] Es gibt insgesamt 18 Modelle: 12 monatliche, 4 saisonale, 1 für Monsunmonate (Mai bis September) und 1 jährliches (wie alle Monatsdurchschnitte). Von den unabhängigen Variablen außer den SSM/I-Schätzungen gingen die Standortvariablen in die meisten Modelle ein. Sowohl LAT als auch LONG haben jeweils 13 Modelle eingereicht, obwohl sie nicht unbedingt immer das gleiche Modell zusammen eingegeben haben. Die am häufigsten in die Modelle eingegebene Geländevariable war der Anteil der südöstlichen Neigung (13 Modelle), gefolgt von der maximalen Höhe innerhalb der 50-km-Puffer (7 Modelle), der minimalen Höhe (6 Modelle), der mittleren Neigung (5 Modelle), Höhenstandardabweichung (4 Modelle) und Westausrichtung (3 Modelle). Die Anteile der nach SW, NW und N ausgerichteten Hänge wurden jeweils in 2 Modelle eingegeben. Flache Steigung (0 Aspekt) und minimale Steigung gingen in kein Modell ein, während maximale Steigung, mittlere Steigung und die verbleibenden Aspektvariablen (NE, E und S) jeweils in 1 Modell eingingen. Alle in den Modellen verbliebenen Variablen waren auf dem 0,05-Niveau statistisch signifikant.

[22] Was die zeitliche Variation des Einflusses von Gelände- und Ortsvariablen angeht, wies das Modell für März die höchsten R 2 , gefolgt vom Modell für September. Die Modelle für Dezember und Februar hatten Tief R 2 Werte. Tatsächlich korrelierte der ursprüngliche SSM/I-Schätzungsniederschlag für Dezember nicht mit dem beobachteten Niederschlag mit statistischer Signifikanz (0,05). Für August wurde der SSM/I-geschätzte Niederschlag ebenfalls nicht in das Modell aufgenommen, obwohl er mit dem am Boden beobachteten Niederschlag auf dem Signifikanzniveau von 0,05 korreliert war. Für Oktober und November flossen die SSM/I-Schätzungen in die Modelle ein, gingen jedoch nicht zuerst in die Modelle ein. Bei den Saisonmodellen war das Wintermodell am niedrigsten R 2-Wert, wiederum aufgrund des Vorhandenseins von Schnee und Eis auf dem größten Teil des tibetischen Plateaus.

[23] Um die Modellstrukturen zu vereinfachen, wurden unabhängige Variablen, die insgesamt ein- oder zweimal in das Modell eingingen, als marginal betrachtet und aus dem Verfahren zur Ableitung der endgültigen Modelle eliminiert. Daher blieben nur acht Gelände- und Ortsvariablen übrig (LAT, LONG, MAX_H, MIN_H, STD_H, MEAN_SLP, SE und W). Tabelle 5 präsentiert die endgültigen Regressionsmodelle basierend auf der schrittweisen Regression sowie der manuellen Auswahl der unabhängigen Variablen. Beispielsweise wurden LAT und MAX_H im Voraus ausgeschlossen, um sicherzustellen, dass die SSM/I-Schätzung für August in das Modell eingehen würde. Es wurde versucht, den gleichen Ansatz für Dezember zu verwenden, jedoch ohne Erfolg, da der SSM/I-Schätzniederschlag statistisch nicht mit dem am Boden beobachteten Niederschlag korreliert. Trotzdem wurde der vom SSM/I geschätzte Niederschlag in das Modell „gezwungen“, um die interannuelle Variabilität widerzuspiegeln, obwohl er statistisch nicht signifikant war. Es wurde festgestellt, dass für die Modelle für Sommer und Monsun (Mai bis September) die SSM/I-Schätzungen in der Endphase eliminiert wurden. Daher wurden für diese Saisons die Modellversionen vor der Eliminierung der SSM/I-Schätzungen als die besten angesehen. Das Signifikanzniveau von 0,1 wurde im Variablenauswahlprozess verwendet, um die Vorhersagekraft zu verbessern, aber fast alle Variablen in den Modellen waren auf dem 0,05-Niveau signifikant.

Monat/Saison Regressionsmodell R2
Januar JAN = −4,215 + 3,166 JAN_EST + 41,195 SE − 0,002 MIN_H + 0,002 MAX_H − 0,706 MEAN_SLP + 32,281 W 0.602
Februar FEB = 72,797 + 1,355 FEB_EST − 0,006 MIN_H − 1,556 LAT + 74,736 W − 1,211 MEAN_SLP 0.406
März MAR = −30.556 + 3.753 MAR_EST + 1.057 LONG − 1.575 LAT − 0.003 MIN_H 0.738
April APR = −21,991 + 0,460 APR_EST + 130,297 SE − 0,008 MIN_H + 1,271 LONG − 2,157 LAT 0.591
Kann MAY = −170,98 + 0,236 MAY_EST + 2,173 LONG + 254.112 SE + 3,953 MEAN_SLP − 0,066 STD_H − 0,007 MIN_H 0.717
Juni JUN = −170,136 + 0,265 JUN_EST + 2,178 LANG + 236.862 SE + 6,488 MEAN_SLP − 0,101 STD_H 0.681
Juli JUL = 203,292 + 0,233 JUL_EST + 313,315 SE − 0,02 MAX_H − 8,907 LAT + 2,467 LONG 0.652
August AUG = −1.612 + 804.741 SE + 0.212 AUG_EST + 7.159 MEAN_SLP − 0.098 STD_H 0.436
September SEP = −36.798 + 0.278 SEP_EST − 4.503 LAT + 2.403 LONG − 0.08 STD_H + 4.004 MEAN_SLP + 211.588 SE 0.704
Oktober OCT = −51.113 + 1.536 LONG − 1.876 LAT − 0.010 MIN_H + 0.568 OCT_EST + 158.320 SE − 0.029 STD_H + 107.318 W 0.643
November NOV = 3,384 − 0,003 MIN_H − 0,757 LAT + 0,311 LONG + 1,031 NOV_EST + 42,748 SE 0.541
Dezember DEC = −5,172 + 0,635 DEC_EST a a DEC_EST war auf dem 0,1-Niveau statistisch nicht signifikant, wurde aber in das Modell gezwungen.
+ 0,013 STD_H + 48,507 SE − 0,479 MEAN_SLP
0.220
Winter WINTER = 0,939 + 3,644 WIN_EST + 181,552 SE − 0,005 MIN_H + 130,083 W − 1,360 MEAN_SLP 0.512
Frühling FEDER = −170.805 + 0.618 SPR_EST + 4.161 LONG − 4.947 LAT − 0.013 MIN_H + 342.192 SE 0.700
Sommer SOMMER = 397.674 + 0.147 SUM_EST + 1067.505 SE − 25.590 LAT + 8.087 LONG − 0.050 MAX_H + 0.019 MIN_H 0.678
Fallen FALL = −37,003 + 0,432 FAL_EST + 390,810 SE + 3,935 LONG − 7,304 LAT − 0,115 STD_H − 0,013 MIN_H + 4,505 MEAN_SLP 0.741
Monsun MONSUN = 275,768 + 0,190 MONS_EST + 1464,711 SE + 13,241 LONG − 33,701 LAT − 0,139 STD_H − 0,039 MAX_H 0.715
Jährlich JÄHRLICH = 14,99 + 0,229 ANN_EST + 169.663 SE + 1.511 LONG − 3.532 LAT − 0.005 MAX_H 0.722

[24] Die Vorzeichen der Regressionskoeffizienten geben die Art des Beitrags der unabhängigen Variablen zur Erklärung der Varianz des Stationsniederschlags an. Von den drei Gelände-/Ortsvariablen, die am häufigsten in die Modelle eingingen (LAT, LONG und SE), waren die Koeffizienten für LAT durchweg negativ, was auf einen abnehmenden Stationsniederschlag für die gleiche Menge an SSM/I-Schätzungen nach Norden hindeutet (Tabelle 5). Die Koeffizienten für LONG waren durchweg positiv, was auf einen zunehmenden Stationsniederschlag für die gleiche Menge an SSM/I-Schätzungen nach Osten hindeutet. Diese beiden Variablen waren ein Hinweis auf den Einfluss der Entfernungen zu Feuchtigkeitsquellen über dem tibetischen Plateau. Frühere Studien legten nahe, dass es zwei Hauptwege für den Feuchtigkeitstransport gibt, einen vom Indischen Ozean/die Bucht von Bengalen zum südöstlichen Teil des Plateaus und einen vom Arabischen Meer zum westlichen Teil des Plateaus [ Ding, 1991 Yanget al., 1989 Tanget al., 1994]. Der nach Nordwesten absteigende Trend deutet auf die Bedeutung der Feuchtigkeitsquellen aus dem Südosten hin, während die ursprünglichen SSM/I-Daten diesen Trend unterschätzten. Ebenso waren die Koeffizienten für SE durchweg positiv, was darauf hindeutet, dass Gebiete mit überwiegend nach Südosten ausgerichteten Hängen tendenziell mehr Niederschlag erhielten und dass die von Südosten kommende Luftströmung eine große Bedeutung für die ganzjährige Niederschlagserzeugung hat.

[25] Während einiger Herbst- und Wintermonate (Januar, Februar und Oktober) und der Wintersaison wirkten sich die Westhänge positiv aus. Da sich die Gürtel der vorherrschenden atmosphärischen Strömungen im Herbst und Winter nach Süden verschieben, spielen die westlichen Strömungen eine wichtige Rolle bei der Niederschlagserzeugung, insbesondere für den westlichen Teil des tibetischen Plateaus. Die einzige andere Variable mit einiger Konsistenz war MIN_H (negativ, außer für Sommer). Niedrige Mindesthöhen in den 50 km langen Puffern fallen oft mit Gebieten am südöstlichen Rand des Plateaus zusammen, einer Region mit relativ hohem Niederschlag. Andererseits war das Vorhandensein von MAX_H bei den saisonalen Werten (negativen Koeffizienten) am auffälligsten. Da der in dieser Studie verwendete Datensatz auf diese Stationen in China beschränkt ist, spiegelt er hauptsächlich den Regenbarriere-/Regenschatteneffekt der Gebirgszüge in der Region wider. Daher fielen Puffer mit höheren maximalen Höhen oft mit Gebieten mit Gebirgszügen auf dem Plateau und niedrigeren Niederschlagswerten für die gleichen SSM/I-Schätzungen zusammen. Alle anderen Gelände-/Ortsvariablen können entweder positive oder negative Koeffizienten haben.

3.4. Eine Fallstudie: 1999

[26] Um zu zeigen, wie die aus dieser Studie erhaltenen Modelle zur Verbesserung der SSM/I-Niederschlagsschätzungen über dem tibetischen Plateau verwendet werden können, haben wir die Modelle auf die Daten für Januar, April, Juli und Oktober 1999 angewendet 1° × 1° Gitterzelle wurde ein 50-km-Puffer in der Mitte entwickelt und verwendet, um Geländeeigenschaften innerhalb des Puffers unter Verwendung des 1 km × 1 km DEM zu berechnen. Dann wurden die ursprünglichen SSM/I-Niederschlagsschätzungen in Kombination mit den Gelände- und Standortvariablen verwendet, um die modellierten Niederschlagsschätzungen zu berechnen. Schließlich wurden die Punktniederschlagsdaten mit Kriging interpoliert. Abbildung 9 zeigt die interpolierten modellierten Niederschlagsschätzungen für Juli 1999. Der modellierte Niederschlag behielt größtenteils die räumliche Gesamtstruktur der ursprünglichen SSM/I-Schätzungen (Abbildung 2) bei, wobei einige lokale Variationsmuster geglättet wurden. Es ist jedoch auch ziemlich offensichtlich, dass zwischen den beiden erhebliche Unterschiede bestanden. Der modellierte Niederschlag war im Allgemeinen höher als die ursprünglichen SSM/I-Schätzungen auf dem tibetischen Plateau, insbesondere in den Bereichen des zentralen Teils des Plateaus. Der SE-NW-Gradient wurde stärker als die ursprünglichen SSM/I-Schätzungen, da das Juli-Modell beide Standortvariablen (LAT und LONG) enthielt.

[27] Wir verglichen die modellierten Niederschlagsschätzungen mit dem Stationsniederschlag, indem wir Niederschlagsfelddaten für die 50-km-Puffer der Wetterstationen extrahierten. Abbildung 10 ist das Streudiagramm der ursprünglichen SSM/I-Schätzungen vom Juli und der modellierten Schätzungen gegenüber dem Stationsniederschlag. Die Regressionsanalyse ergab, dass der modellierte Niederschlag a R 2-Wert von 0,65 im Vergleich zu 0,49 der ursprünglichen SSM/I-Schätzungen und eine fast 1:1-Beziehung zum Stationsniederschlag. Tabelle 6 enthält die Vergleichsergebnisse für Januar, April, Juli und Oktober 1999. Die Verbesserungen gegenüber den ursprünglichen SSM/I-Schätzungen sind in all diesen Monaten zu sehen, obwohl die Modellleistung im Januar immer noch sehr schlecht war. Der quadratische Mittelwertfehler (RMSE) bietet ein weiteres Maß für die Modellleistung. Auch hier sind für alle untersuchten Monate Verbesserungen zu erkennen (Tabelle 6).

Original-SSM/I Modelliertes SSM/I
R 2 Standart Fehler RMSE R 2 Standart Fehler RMSE
Januar 0.013 5.88 6.68 0.190 5.33 5.36
April 0.084 37.29 41.68 0.699 21.37 25.22
Juli 0.493 42.56 50.00 0.654 35.14 34.28
Oktober 0.145 40.25 57.84 0.339 35.40 40.23
  • a Ergebnisse der Regression (R 2 und Standardfehler der Schätzungen) und des mittleren quadratischen Fehlers (RMSE) werden für 35 Stationen präsentiert, die Daten für dieses Jahr hatten.

[28] Die obige Bewertung umfasst jedoch nicht die Gebiete ohne Stationsbeobachtungen. Da in diesen Gebieten keine beobachteten Daten vorhanden waren, haben wir einen anderen Datensatz als Referenz für den Vergleich verwendet. Parameter-elevation Regressions on Independent Slopes Model (PRISM) is an expert system to produce gridded precipitation data on the basis of point data and DEMs [ Daly et al., 1994 , 2002 ]. It has been used successfully to generate precipitation climatology maps for various regions in the United States (http://www.ocs.orst.edu/prism/prism_new.html). A spatial data set of the long-term precipitation norm (1961–1990) was developed using the PRISM system at a 4-km resolution [ Daly et al., 2000 ], on the basis of observations at over 2500 stations across China. The monthly PRISM data were summarized by the 50-km buffers at the 1° × 1° grids and then compared with the long-term means (1987–1999) of the original SSM/I and the modeled precipitation estimates (calculated using the long-term SSM/I means) for the months of January, April, July, and October. Figure 11 shows that the PRISM precipitation for July had a similar spatial pattern to the modeled estimates of July 1999, but with greater details because of a higher spatial resolution. Regression analysis, based on 327 grid points within the approximate range of the Tibetan Plateau, revealed that for these months examined, the modeled precipitation estimates had higher R 2 values when regressed against the PRISM data than the original SSM/I estimates (Table 7), and with lower RMSE values except for January. Both original SSM/I and modeled precipitation estimates were significantly lower than the PRISM July precipitation at a few grid points, which resulted in lower than expected R 2 values. Had the largest 4 outliers been excluded, the R 2 values would have increased to 0.5696 and 0.6545 for the original SSM/I and modeled precipitation estimates and the RMSE lowered to 61.57 and 46.83, respectively.

Original SSM/I Modeled SSM/I
R 2 Standart Fehler RMSE R 2 Standart Fehler RMSE
January 0.171 6.69 7.48 0.216 6.50 9.64
April 0.519 27.66 32.10 0.620 24.55 25.18
July 0.358 90.86 102.25 0.448 84.20 89.46
October 0.396 23.35 30.13 0.671 17.22 17.45
  • a Results of regression (R 2 and standard error of estimates) and root-mean-square errors (RMSE) are presented. The comparison was based on 327 1° × 1° grid points within the approximate range of the Tibetan Plateau.

Einführung

Foot-and-mouth disease (FMD) is a highly infectious viral disease that affects cloven-hoofed animals and has the potential to cause significant economic impact. Rapid disease detection and implementation of control measures to limit geographic spread are high priorities during an outbreak (James and Rushton, 2002 Thompson et al., 2002 Haydon et al., 2004). The effectiveness of control measures can be influenced by characteristics of the virus, geography, livestock density and farm management, and environment in the area of introduction. FMD transmission occurs mainly via droplet nuclei excreted from infectious animals to other animals in close proximity infectious animals can transmit the virus to susceptible animals in as little as 24 h (Alexandersen et al., 2003). The most common FMD transmission routes include direct contact between animals, indirect contact via fomite movement (e.g., vehicles or people), and in some areas, ingestion of infected animal products (Alexandersen et al., 2003). Within a livestock population, different species present different challenges to control FMD. At the individual animal level, cattle are considered most susceptible to airborne FMD spread, as their inhaled dose is likely to be larger than other livestock species due to greater lung capacity (Alexandersen et al., 2003). Ruminants have been shown experimentally to become infected with as little as 10 tissue culture 50% infective doses (TCID50), compared to swine at greater than 10 3 TCID50 (Sørensen et al., 2000 Alexandersen et al., 2003). Although swine have been shown to be relatively resistant to airborne FMD infection, infected swine are an important source of aerosolized FMD virus and are capable of excreting 100 to 1000 times more virus than infected sheep or cattle (Alexandersen and Donaldson, 2002). In the silent spread phase of the 2001 United Kingdom outbreak—prior to imposition of a national ban on livestock movements—FMD spread was attributed mainly to movement of infected livestock, mostly sheep, between premises or through live animal markets before clinical signs were apparent (Gibbens et al., 2001 Haydon et al., 2004). After the national ban on livestock movements, disease response efforts reduced the risk of the most common routes of FMD transmission however, local area spread, which included airborne transmission of the virus, remained difficult to mitigate. In addition to the 2001 UK outbreak (Mikkelsen et al., 2003), airborne spread has been implicated in FMD outbreaks in other countries (Gloster et al., 1982 Daggupaty and Sellers, 1990 Sørensen et al., 2000).

The risk of airborne FMD transmission depends, in part, on the strain or serotype of the virus, topographic factors, the type and number of animals infected (i.e., virus production and concentration), the type and number of animals located downwind from infected animals (i.e., exposures), and weather conditions influencing viral decay (Donaldson, 1972 Cannon and Garner, 1999 Sørensen et al., 2000 Donaldson and Alexandersen, 2002 Alexandersen et al., 2003 Mikkelsen et al., 2003 Colenutt et al., 2016 Van Leuken et al., 2016). Under ideal weather conditions, airborne FMD transmission can occur over short or long range distances (Donaldson et al., 1982 Gloster et al., 2005), and virus has been previously shown to infect susceptible livestock located as far as 250 km downwind from infected premises under suitable weather conditions (Gloster et al., 1982 Sørensen et al., 2000). Aerosolized FMD virus can be dispersed beyond quarantine zones established around detected, infected premises as part of a control program (Donaldson and Alexandersen, 2002).

The U.S. Department of Agriculture’s Foot-and-Mouth Disease Response Plan mandates a minimum Control Area of at least 10 km beyond the perimeter of the closest infected premises following FMD detection (USDA-APHIS, 2014). However, the FMD Response Plan is designed to have the flexibility to adapt the response to outbreak characteristics including evidence of or circumstances favorable to airborne transmission. The United States covers a large, and diverse, geography with widely varying climatic conditions. An enhanced understanding of how weather conditions in the area of infection affect the risk of airborne transmission would allow response officials to consider actual, local weather conditions present during an outbreak while making decisions on control strategies, including Control Area size.

Based on a combination of experimental and observational studies, aerosolized FMD is only viable under certain weather conditions. Experimental data suggest FMD virus infectivity is maximized at relative humidity levels greater than 60% (no known upper bound) and drastically reduced below 55% (Donaldson, 1972). Based on previous FMD outbreaks in which airborne spread was implicated, FMD virus can survive in the environment at temperatures as high as 27 °C (Gloster et al., 1982 Mikkelsen et al., 2003). The exact temperature range for which FMD virus is destabilized is unclear however, and there is no known minimum temperature at which FMD virus inactivation occurs (Donaldson, 1972). Presence of cloud cover, absence of precipitation, stable wind direction, and low to moderate wind speeds are thought to maintain aerosolized FMD virus stability, increasing the possibility of airborne transmission between premises (Hugh-Jones and Wright, 1970 Gloster et al., 1981 Sørensen et al., 2000 Gibbens et al., 2001 Sørensen et al., 2001 Mikkelsen et al., 2003 Gloster et al., 2005).

In the United States, there has been limited research to estimate the risk of airborne FMD spread. The objective of this analysis was to identify seasonal and geographic differences in patterns of environmental conditions favorable to airborne FMD spread in the United States.


TECHNOLOGY

APOGEO Are you building all of your own hardware?

Our founders and partners—Moog, Moog Broad Reach, and Millennium Engineering and Integration Company—are industry leaders in designing, build- ing and operating space sensors, systems and missions, with combined experience of more than 70 years.

Moog is a highly experienced provider of spacecraft systems for both government and commercial customers, with annual revenues of $2.6 billion. For more than 40 years, the international space industry has relied on Moog products for commercial, military and civil/scientific satellite and applications. Moog Broad Reach, founded in 1997 as Broad Reach Engineering and acquired in 2013 by Moog, has a long heritage in mission design and development of instruments and flight systems. Moog Broad Reach specializes in space avionics, systems and software, and built the gold standard for radio occultation sensors currently on orbit.

Millennium Engineering and Integration Company (MEI) is an employee-owned small business and a premier space systems engineering company, with annual revenues of $90 million. MEI has more than 15 years of experience as a leading provider of space systems engineering, satellite integration and testing, and launch and on-orbit operations for NASA, the U.S. Air Force and the Missile Defense Agency.

APOGEO How will you get your satellites into orbit?

Our current plan is to launch the first four satellites as a secondary payload by the end of 2016, with the next eight satellites going up on a dedicated launch vehicle by the end of 2017. However, we will continue to look at any opportunities that could get us to orbit and start delivering data sooner.


2 Antworten 2

The problem with your maps is not the interpolation method you're using, but the way ggplot displays density lines. Here's an answer to this: Remove gaps in a stat_density2d ggplot chart without modifying XY limits.

The density lines go beyond the map, so any polygon that goes outside the plot area is rendered inappropriately (ggplot will close the polygon using the next point of the correspondent level). This does not show up much on your first map because the interpolation resolution is low.

The trick proposed by Andrew is to first expand the plot area, so that the density lines are rendered correctly, then cut off the display area to hide the extra space. Since I tested his solution with your first example, here's the code:

The only differences is that I used min()- / max() + instead of fixed numbers and coord_equal to ensure the map wasn't distorted. In addition, I manually specified a greater number of levels (using bin ), since by increasing the plot area, stat_density automatically chooses a lower resolution.


Materials and Methods

Geographic Interpolation of Endemism (GIE)

We propose the use of a kernel interpolation function, a method commonly used in Geographic Information Systems (GIS) analysis and implemented in several GIS software, to delimit areas of endemism. This interpolation method is based on the definition of circular areas of influence around point occurrences of a phenomenon. Within the area of influence, which is usually defined by the user, the influence of the phenomenon decreases from the point to the limits according to a Gaussian function [19]. For instance, in an epidemiological study of Rabies in China, the area of influence around each infected subject reported was defined as the range of subject´s movement, reflecting transmission probability [20]. The kernel density function estimates the density of occurrence of the phenomenon based on the overlap of the areas of influence [19]. Thus, the results are summarized on a map, expressed as a surface that indicates estimated values of point density. In the method proposed here, the distributional overlap between species is estimated through the distance between centroids of each species distribution range. This method can be applied for identifying areas of endemism through the following sequence of procedures:

  1. Given a set of occurrence points, the centroid of the distribution of each species is estimated through the arithmetic mean of the latitude and longitude of its points (Fig. 1a).
  2. The distance between the centroid and its farthest point of occurrence is measured for each species (Fig. 1b), and this value is used to sort the species into categories of range size (Fig. 1c). The definition of these categories is necessary to define the area of influence of the centroid, as described below, which is a requirement for the kernel index estimation [19].
  3. For each category a value of a radius around the centroid is defined, in order to delimit a circular area of influence of each species range (Fig. 1d). This value can be established through the maximum value of distance between the centroid and the farthest point of each category. For example, in this study all species with up to 100 km of distance between the centroid and the farthest point were grouped in the same category, and this value was defined as the radius around the centroid of all species in the category. The area of influence of each species is a generalization of its distribution range, and thus it must be defined as realistically as possible. Grouping species with differently sized distribution ranges (e.g., species with up to 50 km together with those up to 200 km of maximum distance between the centroid and its farthest point) could result in the overestimation of the range of the more restricted species.
  4. For each category, the overlap between the areas of influence of the species (Fig. 1d) is estimated by the kernel algorithm. The area of influence of each species is expressed as a value that decreases from the centroid to the limits of the circular area according to a Gaussian function (Fig. 1e). The overlap between the areas of influence is estimated through the sum of the values of the overlapping portion, resulting in the kernel index (k). Consequently, the kernel index varies spatially according to the sum of the values of each area of influence, generating a series of overlapped Gaussian curves (Fig. 1e, f). These curves are rasterized, generating a map of density of overlap of areas of influence of species (Fig. 1f), and the kernel index is an indicator of the degree of species distribution overlap.
  5. The results of steps 3 and 4 can be expressed separately for each category or assembled in a consensus map of areas of endemism (Fig. 2). The spatial variation of the kernel index can be displayed with color hues or with isolines (level curves) representing equal values of the index (Fig. 2). The latter option is useful to show the hierarchy between areas of endemism.

a: a centroid is estimated for the points of occurrence of each species. b: For each species, the distance between the centroid and its farthest point is measured. c: species are organized in groups, according to the distance measured in step b. d: This distance is used to define a circular area of influence around each species centroid. This procedure makes it possible to quantify the overlap between areas of distribution among species. e: The degree of overlap between species areas of influence is measured according to a Gaussian function around each species centroid. f: The density of species on each area of overlap, weighted by the degree of overlapping, is converted into interpolated curves using the kernel interpolation function (at left). These curves can be rasterized for display on maps.

Shaded areas indicate the areas of endemism, dashed lines indicate the major areas of endemism delimited according to the kernel index. The insert shows the Brazilian biomes, discussed in the text.

To perform these procedures, a software that calculates the area of influence of each species, as well as an ArcGIS toolbox to implement the method described above, are available in the S1 File in Supporting Information.

Applying GIE to Brazilian spiders

We applied the method described above to delimit areas of endemism of spiders in Brazil using a database of all published distribution records of species described between 1767 and 2013 and two online databases: GBIF [21] and speciesLink [22]. The database includes 3,425 species distributed in 25,072 records (meaning at least one individual of a species collected) and 3,787 localities. About 40% of the species were represented only by single records, 45% had between 2 and 15 records, 10% had between 16 and 60 records and only 2% of the species showed more than 100 records (S1 Fig.). All coordinates reported in the literature and online databases were checked using the ArcGIS software and vector layers of the political boundaries of Brazil to determine whether they actually fit the municipalities and states mentioned in the original data. Of these, 59% of the records were in the correct coordinates. The records that presented incorrect coordinates were georeferenced, as well as records that had no coordinates originally reported. The georeferencing was based on gazetteers and online databases, and 32% of the records were georeferenced in specific localities and only 8% were georeferenced by the location of the municipality. The species taxonomy follows Platnick [23], and species considered nomina dubia were excluded from the analyses. These same records and species were used in the comparative analysis with PAE and NDM. For analysis through GIE the species were classified in nine groups, according to the distance between the centroid and the farthest point: up to 50 km, 51–200 km, 201–400 km, 401–600 km, 601–800 km, 801–1,000 km, 1,001–1,500 km, 1,501–2,000 km and between 2,001 and 3,299 km. Since the definition of these classes can affect the number and location of the areas of endemism, we repeated the analysis with two other categorization schemes: a more inclusive classification with five categories (up to 50 km, 51–400 km, 401–600 km, 601–800 km, 801–3,299 km) and other less inclusive, with 18 categories (up to 25 km, 26–50 km, 51–100 km, 101–200 km, 201–300 km, 301–400 km, 401–500 km, 501–600 km, 601–700 km, 701–800 km, 801–900 km, 901–1,000 km, 1,001–1,300 km, 1,301–1,600 km, 1,601–1,750 km, 1,751–2,000 km, 2,001–2,500 km, 2,501–3,299 km). To compare results, we used Pearson correlation. To generate the consensus map of areas of endemism, the values of the kernel index of each category were standardized between 0 and 1 before assembling the maps. The number of records of a species can affect the position of its distributional centroid, consequently influencing the estimate of the overlap between species in GIE. We estimated this effect through a rarefaction procedure, in which we randomly removed 10, 20 and 30% of the occurrence points and measured the mean deviation of the centroids of the species in 100 randomizations.

The analysis with PAE was based on a presence/absence matrix of spider species over a grid with 168 2×2° cells, completely covering the Brazilian territory (S2 File). As the size of the grid cells can influence the results, we tested several cell sizes (0.5° to 5°) and used the size that allowed the identification of more areas of endemism. The matrix was analyzed through the software TNT [24], based on twenty trees generated by random-addition sequences, followed by TBR Branch Swapping, retaining 20 trees per replicate. The shortest trees obtained were submitted to an additional round of TBR to assure global optimum was found. The trees obtained were rooted in a hypothetical cell with all taxa absent. The areas of endemism were delimited from clades unambiguously supported by at least one non-homoplastic species occurrence, identified in the strict consensus tree.

The same database was analyzed by NDM using the program VNDM [25] (matrix in S3 File), with 2×2° cells. Search factors were set to retain areas with scores equal or above one and presenting one or more endemic species. The search was repeated 100 times, keeping overlapping areas only if 90% of the species in each area are unique. We did not use any parameters to assume the presence of the species in places where they have not been recorded. The results were summarized through the procedure “consensus flexible areas of endemism”, gathering areas that share at least 40% of their endemic species (for more details see [26]).

The results obtained in GIE were compared to results from PAE and NDM through the number of synendemic species (endemic species occurring together in a given area) that supported areas of endemism spatially congruent between methods. In these cases, we consider that areas identified with the highest number of endemic species should indicate a better fit between the boundaries of the area of endemism and the distribution of its species. We also compared the number of areas identified and visually evaluated the overlap between areas generated by each method. Both NDM and GIE show indexes to quantify the support of each area of endemism, so we analyzed the correlation between the score of the areas obtained through these methods using Pearson correlation analysis in Past 1.95 [27]. This analysis was based on values from grid cells of NDM, so the same grid was overlapped to GIE consensus map and 10 random points were used to estimate the average value of the kernel index for each cell.


Present address: Present address: Max Planck Institute for Developmental Biology, Tübingen 72076, Germany.,

Mitgliedschaften

Department of Zoology and Physiology, University of Wyoming, Laramie, 82071, Wyoming, USA

Department of Biology, Box 351800, University of Washington, Seattle, 98195, Washington, USA

George Wang & Raymond B. Huey

You can also search for this author in PubMed Google Scholar

You can also search for this author in PubMed Google Scholar

You can also search for this author in PubMed Google Scholar

Beiträge

M.E.D., G.W. and R.B.H. conceived the project, designed the analyses and wrote the paper M.E.D. and G.W. collated weather station data and did temperature and metabolic rate calculations.

Corresponding author