Dieses Kapitel stellt Ihnen die Konzepte hinter Referenzen zu Perl-Modulen, Paketen und Klassen vor. Es zeigt auch, wie man ein paar Beispielmodule erstellt. Ein Perl-Modul ist ein Satz von Perl-Code, der wie eine Bibliothek von Funktionsaufrufen wirkt. Der Begriff Modul in Perl ist gleichbedeutend mit dem Wortpaket. Pakete sind ein Merkmal von Perl 4, während Module in Perl 5 vorherrschen. Sie können alle Ihre wiederverwendbaren Perl-Code für eine Reihe von Aufgaben in einem Perl-Modul zu halten. Daher ist die gesamte Funktionalität, die sich auf eine Art von Aufgabe bezieht, in einer Datei enthalten. Es ist einfacher, eine Anwendung auf diesen modularen Blöcken zu bauen. Daher wendet sich das Wortmodul etwas mehr als das Paket an. Heres eine kurze Einführung in Module. Bestimmte Themen in diesem Abschnitt werden im Laufe des Buches detailliert behandelt. Lesen Sie die folgenden Absätze sorgfältig durch, um einen Überblick darüber zu erhalten, was bei Ihnen steht, wenn Sie schreiben und Ihre eigenen Module verwenden. Was verwirrend ist, ist, dass die Begriffe Modul und Paket in allen Perl-Dokumentationen austauschbar verwendet werden, und diese beiden Begriffe bedeuten dasselbe. Also beim Lesen Perl Dokumente, nur denken, quotpackagequot, wenn Sie sehen, quotmodulequot und umgekehrt. Also, was ist die Voraussetzung für die Verwendung von Modulen Nun, Module sind da zu verpacken (verzeihen Sie die Wortspiele) Variablen, Symbole und zusammenhängende Datenelemente zusammen. Zum Beispiel mit globalen Variablen mit sehr häufigen Namen wie k. J Oder ich in einem Programm ist in der Regel keine gute Idee. Auch ein Loop-Zähler, i. Sollte in zwei verschiedenen Teilen des Codes selbständig arbeiten dürfen. Wenn du i als globale Variable deklarierst und dann in einer Unterroutine inkrementierst, schaffe es unüberschaubare Probleme mit deinem Anwendungscode, weil die Subroutine aus einer Schleife aufgerufen worden sein kann, die auch eine Variable namens i verwendet. Die Verwendung von Modulen in Perl ermöglicht es, Variablen mit demselben Namen an verschiedenen, verschiedenen Stellen im selben Programm zu erstellen. Die für Ihre Variablen definierten Symbole werden in einem assoziativen Array gespeichert, das als Symboltabelle bezeichnet wird. Diese Symboltabellen sind für ein Paket einzigartig. Daher können Variablen mit demselben Namen in zwei verschiedenen Paketen unterschiedliche Werte haben. Jedes Modul hat eine eigene Symboltabelle aller Symbole, die in ihm deklariert sind. Die Symboltabelle isoliert grundsätzlich auch Namen in einem Modul von einem anderen. Die Symboltabelle definiert einen Namespace. Das heißt, ein Raum für unabhängige Variablennamen existieren in. So verhindert die Verwendung von Modulen mit jeweils einer eigenen Symboltabelle, dass eine Variable, die in einem Abschnitt deklariert ist, die Werte anderer Variablen mit demselben Namen, die an anderer Stelle in derselben angegeben sind, überschreibt Programm. Tatsächlich gehören alle Variablen in Perl zu einem Paket. Die Variablen in einem Perl-Programm gehören zum Hauptpaket. Alle anderen Pakete innerhalb eines Perl-Programms sind entweder in diesem Hauptpaket verschachtelt oder auf derselben Ebene vorhanden. Es gibt einige wirklich globale Variablen, wie das Signalhandler-Array SIG. Die allen anderen Modulen in einem Applikationsprogramm zur Verfügung stehen und nicht über Namespaces isoliert werden können. Nur die variablen Bezeichner, die mit Buchstaben oder Unterstrich beginnen, werden in einer Modul-Symboltabelle gehalten. Alle anderen Symbole, wie die Namen STDIN. STDOUT. STDERR. ARGV ARGVOUT. ENV Inc. Und SIG sind gezwungen, im Paket main zu sein. Das Umschalten zwischen den Paketen betrifft nur Namespaces. Alles, was Sie tun, wenn Sie ein Paket oder ein anderes verwenden, erklärt, welche Symboltabelle als Standard-Symboltabelle für die Suche nach Variablennamen verwendet wird. Nur dynamische Variablen sind von der Verwendung von Symboltabellen betroffen. Variablen, die durch die Verwendung des Schlüsselwortes deklariert wurden, sind immer noch mit dem Codeblock aufgelöst, in dem sie sich befinden, und werden nicht durch Symboltabellen referenziert. Tatsächlich bleibt der Umfang einer Paketdeklaration nur innerhalb des Codeblocks aktiv, in dem es deklariert ist. Wenn Sie also die Symboltabellen mit einem Paket innerhalb einer Unterroutine umschalten, wird die ursprüngliche Symboltabelle, die beim Aufruf des Anrufs wirksam ist, wiederhergestellt Wenn die Subroutine zurückkehrt. Das Umschalten von Symboltabellen wirkt sich nur auf die Standard-Suche von dynamischen Variablennamen aus. Sie können sich immer noch explizit auf Variablen, Dateihandles und so weiter in einem bestimmten Paket verweisen, indem Sie einen Paketnamen voranstellen. Zum Variablennamen. Sie haben gesehen, was ein Paketkontext war, wenn Sie Referenzen in Kapitel 3 verwenden. Ein Paketkontext impliziert einfach die Verwendung der Symboltabelle durch den Perl-Interpreter zum Auflösen von Variablennamen in einem Programm. Durch das Umschalten von Symboltabellen schalten Sie den Paketkontext um. Module können in anderen Modulen verschachtelt werden. Das verschachtelte Modul kann die Variablen und Funktionen des Moduls verwenden, in das es verschachtelt ist. Für verschachtelte Module musst du moduleName verwenden. NestedModuleName und so weiter. Mit dem Doppelkolon (::) geht es auch um mit einem Back-Zitat (). Allerdings ist der Doppelkolon der bevorzugte, zukünftige Weg, um Variablen innerhalb von Modulen zu adressieren. Die explizite Adressierung von Modulvariablen erfolgt immer mit einer vollständigen Referenz. Angenommen, Sie haben ein Modul, Investment. Das ist das Standardpaket im Einsatz, und Sie möchten ein anderes Modul adressieren, Bonds. Die im Investitionsmodul verschachtelt ist. In diesem Fall kannst du Bond nicht benutzen. Stattdessen müssten Sie Investment :: Bond :: verwenden, um Variablen und Funktionen innerhalb des Bond-Moduls zu adressieren. Mit Bond :: würde die Verwendung eines Pakets Bond, das innerhalb des Hauptmoduls und nicht innerhalb des Investment-Moduls verschachtelt ist, implizieren. Die Symboltabelle für ein Modul wird tatsächlich in einem assoziativen Array der Modulnamen gespeichert, die mit zwei Doppelpunkten angehängt sind. Die Symboltabelle für ein Modul namens Bond wird als assoziatives Array Bond :: bezeichnet. Der Name für die Symboltabelle für das Hauptmodul ist main ::. Und kann sogar verkürzt werden auf ::. Ebenso haben alle verschachtelten Pakete ihre Symbole in assoziativen Arrays mit doppelten Doppelpunkten getrennt, die jede Verschachtelungsstufe voneinander trennen. Beispielsweise wird in dem Bond-Modul, das innerhalb des Investment-Moduls verschachtelt ist, das assoziative Array für die Symbole im Bond-Modul als Investment :: Bond :: bezeichnet. Ein Typglob ist wirklich ein globaler Typ für einen Symbolnamen. Sie können Aliasing-Operationen durchführen, indem Sie einem Typglob zuordnen. Ein oder mehrere Einträge in einem assoziativen Array für Symbole werden verwendet, wenn eine Zuordnung über einen Typglob verwendet wird. Der tatsächliche Wert in jedem Eintrag des assoziativen Arrays ist, was Sie beziehen, wenn Sie die VariableName Notation verwenden. So gibt es zwei Möglichkeiten, sich auf Variablennamen in einem Paket zu beziehen: Investment: Geld Investment: Rechnungen Bei der ersten Methode beziehen Sie sich auf die Variablen über eine Typeglob-Referenz. Die Verwendung der Symboltabelle, Investment ::. Ist hier impliziert, und Perl wird die Suche nach Symbolen Geld und Rechnungen zu optimieren. Dies ist die schnellere und bevorzugte Art, ein Symbol zu adressieren. Die zweite Methode verwendet einen Lookup für den Wert einer Variablen, die durch Geld und Rechnungen in dem assoziativen Array für Symbole, Investment :: explizit verwendet wird. Dieser Lookup würde dynamisch durchgeführt und wird nicht von Perl optimiert. Daher wird die Suche gezwungen, das assoziative Array jedes Mal zu überprüfen, wenn die Anweisung ausgeführt wird. Infolgedessen ist die zweite Methode nicht effizient und sollte nur für die Demonstration verwendet werden, wie die Symboltabelle intern implementiert ist. Ein weiteres Beispiel in dieser Aussage kamran husain verursacht Variablen, Unterprogramme und Dateihandles, die über das Symbol kamran benannt werden, um auch über das Symbol husain adressiert zu werden. Das heißt, alle Symboleinträge in der aktuellen Symboltabelle mit dem Schlüssel kamran enthalten nun Verweise auf jene Symbole, die vom Schlüssel husain angesprochen werden. Um eine solche globale Zuordnung zu verhindern, können Sie explizite Referenzen verwenden. Zum Beispiel können Sie mit der folgenden Aussage den Inhalt von husain über die Variable kamran ansprechen. Kamran husain Allerdings werden alle Arrays wie kamran und husain nicht das gleiche sein. Nur was die explizit angegebenen Referenzen geändert werden. Zusammenfassend lässt sich feststellen, wenn Sie einen Typglob einem anderen zuordnen, beeinflussen Sie alle Einträge in einer Symboltabelle unabhängig von der Art der Variablen, auf die verwiesen wird. Wenn Sie eine Referenz von einem Variablentyp zu einem anderen zuordnen, beeinflussen Sie nur einen Eintrag in der Symboltabelle. Eine Perl-Moduldatei hat folgendes Format: Paket Modulname. Modulcode einfügen 1 Der Dateiname muss als ModulName. pm bezeichnet werden. Der Name eines Moduls muss in der Zeichenfolge. pm nach Konvention enden. Die Paketanweisung ist die erste Zeile der Datei. Die letzte Zeile der Datei muss die Zeile mit der 1-Anweisung enthalten. Damit wird mit dem Modul ein wahrer Wert auf das Applikationsprogramm zurückgegeben. Wenn Sie die 1-Anweisung nicht verwenden, wird das Modul nicht korrekt geladen. Die Paketanweisung teilt dem Perl-Interpreter mit, mit einer neuen Namespace-Domain zu beginnen. Grundsätzlich gehören alle Variablen in einem Perl-Skript zu einem Paket namens main. Jede Variable im Hauptpaket kann als mainvariable bezeichnet werden. Heres die Syntax für solche Referenzen: packageNamevariableName Das einfache Zitat () ist gleichbedeutend mit dem Doppelkolon (Operator). Ich decke im nächsten Kapitel mehr Verwendungen des :: Operators ab. Vorläufig müssen Sie sich erinnern, dass die folgenden beiden Anweisungen gleich sind: packageNamevariableName packageName :: variableName Die Double-Colon-Syntax gilt als Standard in der Perl-Welt. Deshalb, um die Lesbarkeit zu bewahren, verwende ich die Doppel-Colon-Syntax im Rest dieses Buches, es sei denn, es ist absolut notwendig, Ausnahmen zu machen, um einen Punkt zu beweisen. Die Standardverwendung eines Variablennamens verweist auf das aktuelle Paket, das zum Zeitpunkt der Kompilierung aktiv ist. Also, wenn Sie im Paket Finance. pm sind und geben Sie eine variable pv. Die Variable ist eigentlich gleich Finance :: pv. Verwenden von Perl-Modulen: use vs. require Sie enthalten Perl-Module in Ihrem Programm, indem Sie die Verwendung oder die require-Anweisung verwenden. Heres den Weg, um eine dieser Aussagen zu verwenden: use ModuleName benötigen ModulName Beachten Sie, dass die. pm-Erweiterung nicht in dem oben gezeigten Code verwendet wird. Beachten Sie auch, dass keine Anweisung erlaubt, dass eine Datei mehr als einmal in ein Programm aufgenommen wird. Der zurückgegebene Wert von true (1) als letzte Anweisung ist erforderlich, um Perl wissen zu lassen, dass ein D-D-D-Modul korrekt geladen und der Perl-Interpreter ignoriert werden kann. Im Allgemeinen ist es besser, die Verwendung Modul-Anweisung zu verwenden, als die Modul-Anweisung in einem Perl-Programm benötigen, um mit zukünftigen Versionen von Perl kompatibel zu bleiben. Für Module, die Sie vielleicht erwägen, die Bedarfserklärung zu verwenden. Heres warum: Die use-Anweisung macht ein bisschen mehr Arbeit als die require-Anweisung, dass sie den Namespace des Moduls ändert, das ein anderes Modul enthält. Sie möchten, dass dieses zusätzliche Update des Namespaces in einem Programm durchgeführt wird. Wenn Sie jedoch Code für ein Modul schreiben, können Sie den Namensraum nicht ändern, es sei denn, es ist explizit erforderlich. In diesem Fall verwenden Sie die Bedarfserklärung. Die Bedarfsanweisung enthält den vollständigen Pfadnamen einer Datei im Inc-Array, so dass sich die Funktionen und Variablen in der Moduldatei während der Ausführungszeit an einem bekannten Ort befinden. Daher werden die Funktionen, die aus einem Modul importiert werden, über eine explizite Modulreferenz zur Laufzeit mit der require-Anweisung importiert. Die use-Anweisung tut dasselbe wie die require-Anweisung, da sie das Inc-Array mit vollständigen Pfadnamen der geladenen Module aktualisiert. Der Code für die use-Funktion geht auch noch einen Schritt weiter und ruft eine Import-Funktion in das Modul, mit dem d die Liste der exportierten Funktionen explizit zur Kompilierzeit geladen wird, wodurch die Zeit für die explizite Auflösung eines Funktionsnamens während der Ausführung gespart wird. Grundsätzlich ist die use-Anweisung gleichbedeutend mit dem ModulName importieren ModuleName Liste der importierten Funktionen Die Verwendung der use-Anweisung ändert Ihren Programm-Namespace, da die importierten Funktionsnamen in die Symboltabelle eingefügt werden. Die Anforderungserklärung ändert nicht Ihren Namespace. Daher ist die folgende Anweisung useNameName () entspricht dieser Anweisung: require ModuleName Funktionen werden aus einem Modul über einen Aufruf einer Funktion namens import importiert. Sie können Ihre eigene Importfunktion in einem Modul schreiben oder das Exporter-Modul verwenden und deren Importfunktion verwenden. In fast allen Fällen werden Sie mit dem Exporter-Modul eine Importfunktion verwenden, anstatt das Rad neu zu erfinden. (Youll erfahren Sie mehr darüber im nächsten Abschnitt.) Sollten Sie sich entscheiden, das Exporter-Modul nicht zu benutzen, müssen Sie in jedem Modul, das Sie schreiben, Ihre eigene Importfunktion schreiben. Es ist viel einfacher, einfach das Exporter-Modul zu benutzen und Perl die Arbeit für dich zu machen. Das Beispiel Letter. pm Modul Der beste Weg, um die Semantik zu veranschaulichen, wie ein Modul in Perl verwendet wird, ist, ein einfaches Modul zu schreiben und zu zeigen, wie man es benutzt. Nehmen wir das Beispiel eines lokalen Darlehens Hai, Rudious Maximus, der einfach müde ist, die gleiche Quittung für paymentquot Buchstaben zu schreiben. Als ein begeisterter Fan von Computern und Perl, Rudious nimmt die faulen Programmierer Ansatz und schreibt ein Perl-Modul, um ihm zu helfen, seine Memos und Briefe zu generieren. Nun, anstatt in Felder in einer Memo-Vorlagendatei einzugeben, muss er nur ein paar Zeilen eingeben, um seine nette, bedrohliche Note zu produzieren. Listing 4.1 zeigt Ihnen, was er eingeben muss. Listing 4.1. Mit dem Letter-Modul. 1 usrbinperl - w 2 3 Uncomment die Zeile unten, um die aktuelle dir in Inc. 4 Push (Inc, pwd) 5 6 verwenden Letter 7 8 Letter :: To ("Rambling Manquot, quotDas Geld für Lucky Dog, Race 2quot) 9 Letter :: ClaimMoneyNice () 10 Letter :: ThankDem () 11 Letter :: Finish () Die use Letter-Anweisung ist vorhanden, um den Perl-Interpreter zu zwingen, den Code für das Modul in das Anwendungsprogramm aufzunehmen. Das Modul sollte sich im Verzeichnis usrlibperl5 befinden, oder Sie können es in jedem Verzeichnis platzieren, das im Inc-Array aufgeführt ist. Das Inc-Array ist die Liste der Verzeichnisse, die der Perl-Interpreter sucht, wenn versucht wird, den Code für das benannte Modul zu laden. Die kommentierte Zeile (Nummer 4) zeigt, wie Sie das aktuelle Arbeitsverzeichnis hinzufügen, um den Pfad einzuschließen. Die nächsten vier Zeilen in der Datei erzeugen den Gegenstand für den Brief. Heres die Ausgabe von der Verwendung des Letter-Moduls: An: Mr. Gambling Man Fm: Rudious Maximus, Loan Shark Dt: Mi Feb 7 10:35:51 CST 1996 Re: Das Geld für Lucky Dog, Race 2 Es ist mir aufmerksam geworden Dass Ihr Konto ist weit über fällig. Du wirst uns bald bezahlen Oder möchtest du, dass ich ovah komme Danke für deine Unterstützung. Die Letter-Modul-Datei wird in Listing 4.2 angezeigt. Der Name des Pakets wird in der ersten Zeile deklariert. Da diese Module Funktionen exportiert werden, verwende ich das Exporter-Modul. Daher ist die Anweisung Exporter erforderlich, um die Funktionalität aus dem Exporter-Modul zu erben. Ein weiterer erforderlicher Schritt ist, das Wort Exports in das ISA-Array zu setzen, um die Suche nach Exported. pm zu ermöglichen. Das ISA-Array ist ein spezielles Array in jedem Paket. Jedes Element im Array listet wo sonst noch eine Methode zu suchen, wenn es nicht im aktuellen Paket gefunden werden kann. Die Reihenfolge, in der Pakete im ISA-Array aufgeführt sind, ist die Reihenfolge, in der Perl nach ungelösten Symbolen sucht. Eine Klasse, die im ISA-Array aufgelistet wird, wird als Basisklasse dieser bestimmten Klasse bezeichnet. Perl cache fehlende Methoden, die in Basisklassen für zukünftige Referenzen gefunden wurden. Das Ändern des ISA-Arrays bündelt den Cache und veranlasst Perl, alle Methoden erneut zu durchsuchen. Lets jetzt schauen Sie sich den Code für Letter. pm in Listing 4.2. Listing 4.2. Das Modul Letter. pm 1 Paket Letter 2 3 erfordern Exporteur 4 ISA (Exporteur) 5 6 head1 NAME 7 8 Letter - Beispielmodul zur Erstellung von Briefkopf für Sie 9 10 head1 SYNOPSIS 11 12 use Letter 13 14 Letter :: Date () 15 Letter :: To (name , Firma, Adresse) 16 17 Dann einer der folgenden: 18 Letter :: ClaimMoneyNice () 19 Letter :: ClaimMoney () 20 Letter :: ThreatBreakLeg () 21 22 Letter :: ThankDem () 23 Letter :: Finish () 24 25 head1 BESCHREIBUNG 26 27 Dieses Modul bietet ein kurzes Beispiel für die Erstellung eines Briefes für einen 28 freundlichen Neighborbood Darlehen Hai. 29 30 Der Code beginnt nach der quotcutquot-Anweisung. 31 schneiden 32 33 EXPORT qw (Datum, 34 an, 35 ClaimMoney, 36 ClaimMoneyNice, 37 ThankDem, 38 Finish) 39 40 41 Drucken heutiges Datum 42 43 Sub Letter :: Datum 44 Datum Datum 45 drucken quotn Heute ist datequot 46 47 48 sub Letter :: To 49 local (name) shift 50 lokal (subject) shift 51 print quotn An: namequot 52 print quotn Fm: Rudious Maximus, Loan Sharkquot 53 print quotn Dt: quot, date 54 print quotn Re: subjectquot 55 drucken quotnnquot 56 Print quotnnquot 57 58 sub Letter :: ClaimMoney () 59 print quotn Du schuldest mir Geld. Holen Sie sich Ihre Handlung zusammenquoten 60 print quotn Wollen Sie, dass ich Bruno zu schicken, um zu drucken. Oder sind Sie gonna pay upquot 62 63 64 sub Letter :: ClaimMoneyNice () 65 print quotn Es ist zu meiner Aufmerksamkeit gekommen, dass Ihr Konto ist 66 Druck quotn Weg über due. quot 67 print quotn Sie gonna bezahlen uns bald..quot 68 Print quotn oder möchtest du, dass ich komme ovahquot 69 70 71 sub Letter :: ThreatBreakLeg () 72 print quotn anscheinend Briefe wie diese dont helpquot 73 print quotn Ich muss ein Beispiel von youquot 74 drucken quotn n sehen Sie im Krankenhaus , Palquot 75 76 77 sub Letter :: ThankDem () 78 print quotnn Vielen Dank für Ihr Supportquot 79 80 81 sub Letter :: Finish () 82 printf quotnnnn Sincerelyquot 83 printf quotn Rudious n 84 84 86 1 Zeilen mit dem Gleichheitszeichen werden verwendet Für die Dokumentation. Sie müssen jedes Modul für Ihre eigene Referenz dokumentieren Perl-Module müssen nicht dokumentiert werden, aber es ist eine gute Idee, ein paar Zeilen darüber zu schreiben, was Ihr Code tut. Ein paar Jahre ab jetzt können Sie vergessen, was ein Modul ist. Gute Dokumentation ist immer ein Muss, wenn du dich erinnern möchtest, was du in der Vergangenheit getan hast, decke ich die für Perl in Kapitel 8 verwendeten Dokumentationsstile ab. QuotDocumenting Perl Scripts. quot Für dieses Beispielmodul beginnt die head1-Anweisung die Dokumentation. Alles bis zum Cut-Statement wird vom Perl-Interpreter ignoriert. Als nächstes listet das Modul alle Funktionen auf, die von diesem Modul im EXPORT-Array exportiert werden. Das EXPORT-Array definiert alle Funktionsnamen, die von externem Code aufgerufen werden können. Wenn Sie keine Funktion in diesem EXPORT-Array auflisten, wird es nicht von externen Code-Modulen gesehen. Nach dem EXPORT-Array ist der Körper des Codes, eine Unterroutine zu einer Zeit. Nachdem alle Unterroutinen definiert sind, beendet die endgültige Anweisung 1 die Moduldatei. 1 muss die letzte ausführbare Zeile in der Datei sein. Schauen wir uns einige der in diesem Modul definierten Funktionen an. Die erste Funktion zu betrachten ist die einfache Datumsfunktion, Zeilen 43 bis 46, die das aktuelle UNIX Datum und Uhrzeit ausdruckt. Es gibt keine Parameter für diese Funktion, und es gibt nichts sinnvoll zurück an den Anrufer. Beachten Sie die Verwendung von meinem vor dem Datum variabel in Zeile 44. Das Schlüsselwort wird verwendet, um den Umfang der Variablen innerhalb der Datumsfunktionen curly Klammern zu begrenzen. Code zwischen geschweiften Klammern wird als Block bezeichnet. Variablen, die innerhalb eines Blocks deklariert sind, sind im Geltungsbereich innerhalb der geschweiften Klammern begrenzt. In 49 und 50 sind die lokalen Variablen Name und Thema für alle Funktionen sichtbar. Sie können auch Variablen mit dem lokalen Qualifikationsmerkmal deklarieren. Die Verwendung von local ermöglicht es, dass eine Variable in den Gültigkeitsbereich für den aktuellen Block sowie für andere Codeblöcke ist, die in diesem Block aufgerufen werden. Somit ist ein lokales x, das innerhalb eines Blocks deklariert ist, für alle nachfolgenden, in diesem Block aufgerufenen Blöcke sichtbar und kann referenziert werden. Im folgenden Beispielcode kann auf die Namensvariable ToTitled-Funktion zugegriffen werden, aber nicht die Daten im iPhone. 1 sub Letter :: ToTitled 2 lokal (name) shift 3 meine (telefon) shift Der Beispielcode für Letter. pm zeigte, wie man einen Parameter zu einem Zeitpunkt extrahiert. Die Unterroutine To () übernimmt zwei Parameter, um den Header für das Memo einzurichten. Die Verwendung von Funktionen innerhalb eines Moduls ist nicht anders als die Verwendung und Definition von Perl-Modulen innerhalb der gleichen Code-Datei. Parameter werden per Referenz übergeben, sofern nicht anders angegeben. Mehrere Arrays, die in eine Subroutine übergeben wurden, wenn nicht explizit mit dem Backslash dereferenziert, sind verkettet. Das Eingabefeld in einer Funktion ist immer ein Array von Skalarwerten. Übergeben von Werten durch Verweis ist der bevorzugte Weg in Perl, um eine große Menge von Daten in eine Unterroutine zu übergeben. (Siehe Kapitel 3. quotReferences. quot) Ein weiteres Beispielmodul: Finanzen Das Finanzierungsmodul, das in Listing 4.3 gezeigt wird, wird verwendet, um einfache Berechnungen für Kreditwerte zu liefern. Die Verwendung des Finanzmoduls ist einfach. Alle Funktionen werden mit den gleichen Parametern geschrieben, wie in der Formel für die Funktionen gezeigt. Schauen wir uns an, wie der zukünftige Wert einer Investition berechnet werden kann. Zum Beispiel, wenn Sie einige Dollar investieren, pv. In einer Anleihe, die einen festen Prozentsatz anbietet, r. Angewendet in bekannten Intervallen für n Zeiträume, was ist der Wert der Bindung zum Zeitpunkt des Ablaufs In diesem Fall verwenden Sie die folgende Formel: fv pv (1r) n Die Funktion, um den zukünftigen Wert zu erhalten, wird als FutureValue deklariert . Siehe Listing 4.3, um zu sehen, wie man es benutzt. Listing 4.3. Mit dem Finanzmodul. 1 usrbinperl - w 2 3 Push (Inc, pwd) 4 Verwendung Finanzen 5 6 Darlehen 5000.00 7 Apr 3.5 APR 8 Jahr 10 in Jahren. 9 10 ------------------------------------------------ ---------------- 11 Berechnen Sie den Wert am Ende des Darlehens, wenn Zinsen 12 jedes Jahr angewendet wird. 13 ------------------------------------------------- --------------- 14 Zeitjahr 15 fv1 Finanzen :: FutureValue (Darlehen, April, Zeit) 16 print quotn Wenn Zinsen am Ende des Geschäftsjahres angewendet werden 17 print quotn Der zukünftige Wert für a Darlehen von quot. Darlehen. Quotnquot 18 print quot bei einem APR von quot, apr. Für die Zeit, jdt. Jahrgang 19 printf quot ist 8.2f nquot. Fv1 20 21 ----------------------------------------------- ----------------- 22 Berechnen Sie den Wert am Ende des Darlehens, wenn Zinsen 23 jeden Monat angewendet wird. 24 ------------------------------------------------- --------------- 25 rate April 12 APR 26 Zeit Jahr 12 in Monaten 27 fv2 Finanzen :: FutureValue (Darlehen, Zinssatz, Zeit) 28 29 print quotn Wenn Zinsen am Ende des Geschäftsjahres angewendet werden Jeder Monat 30 print quotn Der zukünftige Wert für ein Darlehen von quot. Darlehen. Quotnquot 31 drucken bei einem APR von quot, apr. Für quot, time, quot monthquot 32 printf quot ist 8.2f nquot. Fv2 33 34 printf quotn Der Unterschied im Wert ist 8.2fquot, fv2 - fv1 35 printf quotn Deshalb durch Anwenden von Interesse an kürzeren Zeitspannen 36 printf quotn Wir sind eigentlich immer mehr Geld in interest. nquot Hier ist Stichprobeneingabe und Ausgabe von Listing 4.3. Testme Wenn Zinsen am Ende des Jahres angewendet werden Der zukünftige Wert für ein Darlehen von 5000 bei einem APR von 3,5 für 10 Jahre beträgt 7052,99 Wenn Zinsen am Ende eines jeden Monats angewendet wird Der zukünftige Wert für ein Darlehen von 5000 bei einem APR von 3,5 für 120 Monate ist 7091.72 Der Unterschied im Wert ist 38.73 Deshalb, indem wir Interesse an kürzeren Zeiträumen anwenden, sind wir eigentlich immer mehr Geld im Interesse. Die Offenbarung in der Ausgabe ist das Ergebnis des Vergleichs von Werten zwischen fv1 und fv2. Der fv1-Wert wird mit der Anwendung von Interesse einmal jährlich über die Lebensdauer der Anleihe berechnet. Fv2 ist der Wert, wenn die Zinsen jeden Monat auf den entsprechenden monatlichen Zinssatz angewendet werden. Das Paket Finance. pm wird in Listing 4.4 in seinen frühen Entwicklungsstadien gezeigt. Listing 4.4. Das Paket Finance. pm. 1 Paket Finanzen 2 3 erfordern Exporteur 4 ISA (Exporteur) 5 6 head1 Finance. pm 7 8 Finanzrechner - Finanzrechnungen leicht gemacht mit Perl 9 10 Kopf 2 11 Einsatz Finanzen 12 13 pv 10000.0 14 15 Rate 12,5 12 APR pro Monat. 16 17 Zeit 360 Monate für Ausleihen 18 19 fv FutureValue () 20 21 print fv 22 23 cut 24 25 EXPORT qw (FutureValue, 26 PresentValue, 27 FVofAnnuity, 28 AnnuityOfFV, 29 getLastAverage, 30 getMovingAverage, 31 SetInterest) 32 33 34 Globals, falls vorhanden 35 36 37 local defaultInterest 5.0 38 39 sub Finance :: SetInterest () 40 meine Rate Verschiebung () 41 defaultInterest Rate 42 printf quotn defaultInterest ratequot 43 44 45 -------------- -------------------------------------------------- ---- 46 Anmerkungen: 47 1. Der Zinssatz r wird im Wert von 0-100 angegeben. 48 2. Die in den Begriffen angegebene n ist der Satz, zu dem die Zinsen 49 angewandt werden. 50 51 ------------------------------------------------ -------------------- 52 53 ---------------------------- ---------------------------------------- 54 Gegenwärtiger Wert einer Investition in Höhe von 55 fv - Ein zukünftiger Wert 56 r - Rate pro Periode 57 n - Anzahl der Perioden 58 ---------------------------------- ---------------------------------- 59 sub Finance :: FutureValue () 60 mein (pv, r, n ) 61 mein fv pv ((1 (r100)) n) 62 return fv 63 64 65 ------------------------------ -------------------------------------- 66 Gegenwärtiger Wert einer Investition in Höhe von 67 fv - eine Zukunft Wert 68 r - Rate pro Periode 69 n - Anzahl der Periode 70 ------------------------------------ -------------------------------- 71 sub Finance :: PresentValue () 72 mein pv 73 mein (fv, r, N) 74 pv fv ((1 (r100)) n) 75 zurück pv 76 77 78 79 ----------------------------- --------------------------------------- 80 Erhalten Sie den zukünftigen Wert einer Annuität mit 81 mp - Monatliche Zahlung der Annuität 82 r - Rate pro Periode 83 n - Anzahl der Periode 84 -------------------------------- ------------------------------------ 85 86 sub FVofAnnuity () 87 meine fv 88 meine oneR 89 meine (Mp, r, n) 90 91 oneR (1 r) n 92 fv mp ((oneR - 1) r) 93 return fv 94 95 96 ------------------ -------------------------------------------------- 97 Holen Sie sich die Annuität aus den folgenden Bits von Informationen 98 r - Rate pro Periode 99 n - Anzahl der Periode 100 fv - Future Value 101 ---------------------- ---------------------------------------------- 102 103 sub AnnuityOfFV (Nr, r, n) 107 108 oneR (1 r) n 109 mp fv (r (oneR - 1)) 110 Rückkehr mp 111 112 113 - -------------------------------------------------- ---------------- 114 Holen Sie sich den Durchschnitt der letzten quotnquot Werte in einem Array. 115 ------------------------------------------------- ------------------- 116 Die letzte Zählzahl der Elemente aus dem Array in den Werten 117 Die Gesamtzahl der Elemente in den Werten ist in der Zahl 118 119 sub getLastAverage () 120 my (Count, number, values) 121 my i 122 123 my a 0 124 return 0 if (count 0) 125 für (i 0 ilt count i) 126 a Werte nummer - i - 1 127 128 einen Zählwert zurückgeben 129 130 131 --- -------------------------------------------------- --------------- 132 Holen Sie sich einen gleitenden Durchschnitt der Werte. 133 ------------------------------------------------- ------------------- 134 Die Fenstergröße ist der erste Parameter, die Anzahl der Elemente im 135 übergebenen Array ist als nächstes. (Dies kann leicht innerhalb der 136-Funktion mit der Skalar () - Funktion berechnet werden, aber die hier gezeigte Subroutine 137 wird auch verwendet, um zu veranschaulichen, wie man Zeiger übergibt.) Die Referenz auf das 138-Array von Werten wird als nächstes weitergeleitet, gefolgt von a Verweis auf den Ort 139 sind die Rückgabewerte zu speichern. 140 141 sub getMovingAve () 142 mein (count, number, values, movingAve) 143 my i 144 my a 0 145 my v 0 146 147 Rückgabe 0 if (count 0) 148 return -1 if (count gt number) 149 zurück - 2, wenn (count lt 2) 150 151 movingAve0 0 152 movingAvenumber - 1 0 153 für (i0 iltcounti) 154 v valuesi 155 av count 156 movingAvei 0 157 158 für (icount iltnumberi) 159 v valuesi 160 av count 161 v valuesi - count - 1 162 a - v count 163 movingAvei a 164 165 return 0 166 167 168 1 Schau auf die Deklaration der Funktion FutureValue mit (). Die drei Dollarzeichen zusammen bedeuten drei Skalarzahlen, die in die Funktion übergeben werden. Diese zusätzliche Scoping ist vorhanden für die Validierung der Art der Parameter in die Funktion übergeben. Wenn du einen String anstelle einer Zahl in die Funktion übergeben würdest, würdest du eine Nachricht sehr ähnlich zu diesem bekommen: Zu viele Argumente für Finanzen :: FutureValue bei. f4.pl Zeile 15, nahe Quottime) Ausführung von. f4.pl abgebrochen durch Kompilierungsfehler. Die Verwendung von Prototypen bei der Definition von Funktionen verhindert, dass Sie andere Werte als das, was die Funktion erwartet, senden. Verwenden Sie oder um ein Array von Werten zu übergeben. Wenn Sie durch Verweis übergeben, verwenden Sie oder um einen skalaren Verweis auf ein Array bzw. einen Hash zu zeigen. Wenn Sie den Backslash nicht verwenden, werden alle anderen Typen im Argumentliste Prototyp ignoriert. Andere Arten von Disqualifikatoren umfassen ein Und-Zeichen für einen Verweis auf eine Funktion, ein Sternchen für jeden Typ und ein Semikolon, um anzuzeigen, dass alle anderen Parameter optional sind. Nun schauen wir uns die lastMovingAverage-Funktionsdeklaration an, die zwei Integer in der Front angibt, gefolgt von einem Array. Die Art und Weise, wie die Argumente in der Funktion verwendet werden, besteht darin, jedem der beiden Skalare, Zählung und Nummer einen Wert zuzuordnen. Wohingegen alles andere an das Array geschickt wird. Schauen Sie sich die Funktion getMovingAverage () an, um zu sehen, wie zwei Arrays übergeben werden, um den gleitenden Durchschnitt auf einer Liste von Werten zu erhalten. Der Weg, um die Funktion getMovingAverage aufzurufen, wird in Listing 4.5 angezeigt. Listing 4.5. Mit der gleitenden Mittelfunktion. 1 usrbinperl - w 2 3 push (Inc, pwd) 4 Verwendung Finanzen 5 6 Werte (12,22,23,24,21,23,24,23,23,21,29,27,26,28) 7 mv ( 0) 8 Größe Skalar (Werte) 9 print quotn Werte zur Arbeit mit nquot 10 print quot Anzahl Werte Größe nquot 11 12 ------------------------ ---------------------------------------- 13 Berechnen Sie den Durchschnitt der obigen Funktion 14 - -------------------------------------------------- ------------- 15 ave Finanzen :: getLastAverage (5, Größe, Werte) 16 print quotn Durchschnitt der letzten 5 Tage ave nquot 17 18 Finanzen :: getMovingAve (5, Größe, Werte, mv ) 19 print quotn Moving Average mit 5 Tage Fenster n nquot Heres die Ausgabe von Listing 4.5: Werte zur Arbeit mit Anzahl der Werte 14 Durchschnitt der letzten 5 Tage 26.2 Die Funktion getMovingAverage () nimmt zwei Skalare und dann zwei Verweise auf Arrays als Skalare. Innerhalb der Funktion werden die beiden Skalare zu den Arrays zur Verwendung als numerische Arrays dereferenziert. Der zurückgegebene Satz von Werten wird in den als zweiten Referenz übergebenen Bereich eingefügt. Wurden die Eingabeparameter nicht für jedes referenzierte Array angegeben, wäre die moveAve-Array-Referenz leer und hätte Fehler zur Laufzeit verursacht. Mit anderen Worten, die folgende Deklaration ist nicht korrekt: sub getMovingAve () Die daraus resultierende Fehlermeldung von Fehlermeldungen aus einem schlechten Funktionsprototyp ist wie folgt: Verwendung von nicht initialisiertem Wert bei Finance. pm Zeile 128. Verwendung von nicht initialisiertem Wert bei Finance. pm Zeile 128. Verwendung von nicht initialisiertem Wert bei Finance. pm Zeile 128. Verwendung von nicht initialisiertem Wert bei Finance. pm Zeile 128. Verwendung von nicht initialisiertem Wert bei Finance. pm Zeile 128. Verwendung von uninitialisiertem Wert bei Finance. pm Zeile 133. Verwendung von nicht initialisiertem Wert Bei Finance. pm Zeile 135. Verwendung von uninitialisiertem Wert bei Finance. pm Zeile 133. Verwendung von nicht initialisiertem Wert bei Finance. pm Zeile 135. Verwendung von nicht initialisiertem Wert bei Finance. pm Zeile 133. Verwendung von nicht initialisiertem Wert bei Finance. pm Zeile 135 Verwendung von nicht initialisiertem Wert bei Finance. pm Zeile 133. Verwendung von nicht initialisiertem Wert bei Finance. pm Zeile 135. Verwendung von nicht initialisiertem Wert bei Finance. pm Zeile 133. Verwendung von nicht initialisiertem Wert bei Finance. pm Zeile 135. Verwendung von nicht initialisiertem Wert bei Finance. pm line 133. Use of uninitialized value at Finance. pm line 135. Use of uninitialized value at Finance. pm line 133. Use of uninitialized value at Finance. pm line 135. Use of uninitialized value at Finance. pm line 133. Use of uninitialized value at Finance. pm line 135. Use of uninitialized value at Finance. pm line 133. Use of uninitialized value at Finance. pm line 135. Average of last 5 days 26.2 Moving Average with 5 days window This is obviously not the correct output. Therefore, its critical that you pass by reference when sending more than one array. Global variables for use within the package can also be declared. Look at the following segment of code from the Finance. pm module to see what the default value of the Interest variable would be if nothing was specified in the input. (The current module requires the interest to be passed in, but you can change this.) Heres a little snippet of code that can be added to the end of the program shown in Listing 4.5 to add the ability to set interest rates. 20 local defaultInterest 5.0 21 sub Finance::SetInterest() 22 my rate shift() 23 rate -1 if (rate lt 0) 24 defaultInterest rate 25 printf quotn defaultInterest ratequot 26 The local variable defaultInterest is declared in line 20. The subroutine SetInterest to modify the rate is declared in lines 21 through 26. The rate variable uses the values passed into the subroutine and simply assigns a positive value for it. You can always add more error checking if necessary. To access the defaultInterest variables value, you could define either a subroutine that returns the value or refer to the value directly with a call to the following in your application program: Finance::defaultInterest The variable holding the return value from the module function is declared as my variable . The scope of this variable is within the curly braces of the function only. When the called subroutine returns, the reference to my variable is returned. If the calling program uses this returned reference somewhere, the link counter on the variable is not zero therefore, the storage area containing the returned values is not freed to the memory pool. Thus, the function that declares my pv and then later returns the value of pv returns a reference to the value stored at that location. If the calling routine performs a call like this one: Finance::FVofAnnuity(monthly, rate, time) there is no variable specified here into which Perl stores the returned reference therefore, any returned value (or a list of values) is destroyed. Instead, the call with the returned value assigned to a local variable, such as this one: fv Finance::FVofAnnuity(monthly, rate, time) maintains the variable with the value. Consider the example shown in Listing 4.6, which manipulates values returned by functions. Listing 4.6. Sample usage of the my function. 1 usrbinperl - w 2 3 push(Inc, pwd) 4 use Finance 5 6 monthly 400 7 rate 0.2 i. e. 6 APR 8 time 36 in months 9 10 print quotn ------------------------------------------------quot 11 fv Finance::FVofAnnuity(monthly, rate, time) 12 printf quotn For a monthly 8.2f at a rate of 6.2f for d periodsquot, 13 monthly, rate, time 14 printf quotn you get a future value of 8.2f quot, fv 15 16 fv 1.1 allow 10 gain in the house value. 17 18 mo Finance::AnnuityOfFV(fv, rate, time) 19 20 printf quotn To get 10 percent more at the end, i. e. 8.2fquot, fv 21 printf quotn you need a monthly payment value of 8.2fquot, mo, fv 22 23 print quotn ------------------------------------------------ nquot Here is sample input and output for this function: testme ------------------------------------------------ For a monthly 400.00 at a rate of 0.20 for 36 periods you get a future value of 1415603.75 To get 10 percent more at the end, i. e. 1557164.12 you need a monthly payment value of 440.00 ------------------------------------------------ Modules implement classes in a Perl program that uses the object-oriented features of Perl. Included in object-oriented features is the concept of inheritance . (Youll learn more on the object-oriented features of Perl in Chapter 5. quotObject-Oriented Programming in Perl. quot) Inheritance means the process with which a module inherits the functions from its base classes. A module that is nested within another module inherits its parent modules functions. So inheritance in Perl is accomplished with the :: construct. Heres the basic syntax: SuperClass::NextSubClass. ThisClass. The file for these is stored in. SuperClassNextSubClass133 . Each double colon indicates a lower-level directory in which to look for the module. Each module, in turn, declares itself as a package with statements like the following: package SuperClass::NextSubClass package SuperClass::NextSubClass::EvenLower For example, say that you really want to create a Money class with two subclasses, Stocks and Finance . Heres how to structure the hierarchy, assuming you are in the usrlibperl5 directory: Create a Money directory under the usrlibperl5 directory. Copy the existing Finance. pm file into the Money subdirectory. Create the new Stocks. pm file in the Money subdirectory. Edit the Finance. pm file to use the line package Money::Finance instead of package Finance . Edit scripts to use Money::Finance as the subroutine prefix instead of Finance:: . Create a Money. pm file in the usrlibperl5 directory. The Perl script that gets the moving average for a series of numbers is presented in Listing 4.7. Listing 4.7. Using inheriting modules. 1 usrbinperl - w 2 aa pwd 3 aa . quotMoneyquot 4 push(Inc, aa) 5 use Money::Finance 6 values ( 12,22,23,24,21,23,24,23,23,21,29,27,26,28 ) 7 mv (0) 8 size scalar(values) 9 print quotn Values to work with nquot 10 print quot Number of values size nquot 11 ---------------------------------------------------------------- 12 Calculate the average of the above function 13 ---------------------------------------------------------------- 14 ave Money::Finance::getLastAverage(5,size, values) 15 print quotn Average of last 5 days ave nquot 16 Money::Finance::getMovingAve(5,size, values, mv) 17 foreach i (values) 18 print quotn Moving with 5 days window mvi nquot 19 20 print quotn Moving Average with 5 days window n nquot Lines 2 through 4 add the path to the Money subdirectory. The use statement in line 5 now addresses the Finance. pm file in the. Money subdirectory. The calls to the functions within Finance. pm are now called with the prefix Money::Finance:: instead of Finance:: . Therefore, a new subdirectory is shown via the :: symbol when Perl is searching for modules to load. The Money. pm file is not required. Even so, you should create a template for future use. Actually, the file would be required to put any special requirements for initialization that the entire hierarchy of modules uses. The code for initialization is placed in the BEGIN() function. The sample Money. pm file is shown in Listing 4.8. Listing 4.8. The superclass module for Finance. pm . 1 package Money 2 require Exporter 3 4 BEGIN 5 printf quotn Hello Zipping into existence for younquot 6 7 1 To see the line of output from the printf statement in line 5, you have to insert the following commands at the beginning of your Perl script: use Money use Money::Finance To use the functions in the Stocks. pm module, you use this line: use Money::Stocks The Stocks. pm file appears in the Money subdirectory and is defined in the same format as the Finance. pm file, with the exceptions that use Stocks is used instead of use Finance and the set of functions to export is different. A number of modules are included in the Perl distribution. Check the usrlibperl5lib directory for a complete listing after you install Perl. There are two kinds of modules you should know about and look for in your Perl 5 release, Pragmatic and Standard modules. Pragmatic modules, which are also like pragmas in C compiler directives, tend to affect the compilation of your program. They are similar in operation to the preprocessor elements of a C program. Pragmas are locally scoped so that they can be turned off with the no command. Thus, the command no POSIX turns off the POSIX features in the script. These features can be turned back on with the use statement. Standard modules bundled with the Perl package include several functioning packages of code for you to use. Refer to appendix B, quotPerl Module Archives, quot for a complete list of these standard modules. To find out all the. pm modules installed on your system, issue the following command. (If you get an error, add the usrlibperl5 directory to your path.) find usrlibperl5 - name perl quot. pmquot - print Extension modules are written in C (or a mixture of Perl and C) and are dynamically loaded into Perl if and when you need them. These types of modules for dynamic loading require support in the kernel. Solaris lets you use these modules. For a Linux machine, check the installation pages on how to upgrade to the ELF format binaries for your Linux kernel. The term CPAN (Comprehensive Perl Archive Network) refers to all the hosts containing copies of sets of data, documents, and Perl modules on the Net. To find out about the CPAN site nearest you, search on the keyword CPAN in search engines such as Yahoo. AltaVista, or Magellan. A good place to start is the metronet site . This chapter introduced you to Perl 5 modules and described what they have to offer. A more comprehensive list is found on the Internet via the addresses shown in the Web sites metronet and perl . A Perl package is a set of Perl code that looks like a library file. A Perl module is a package that is defined in a library file of the same name. A module is designed to be reusable. You can do some type checking with Perl function prototypes to see whether parameters are being passed correctly. A module has to export its functions with the EXPORT array and therefore requires the Exporter module. Modules are searched for in the directories listed in the Inc array. Obviously, there is a lot more to writing modules for Perl than what is shown in this chapter. The simple examples in this chapter show you how to get started with Perl modules. In the rest of the book I cover the modules and their features, so hang in there. I cover Perl objects, classes, and related concepts in Chapter 5.With weight vector I mean the vector with weights that you have to multiply the observations in the window that slides over your data with so if you add those products together it returns the value of the EMA on the right side of the window. For a linear weighted moving average the formula for finding the weight vector is: (1:n)sum(1:n) (in R code). This series of length n adds up to 1. For n10 it will be 0.01818182 0.03636364 0.05454545 0.07272727 0.09090909 0.10909091 0.12727273 0.14545455 0.16363636 0.18181818 the numbers 1 to 10 55, with 55 the sum of the numbers 1 to 10. How do you calculate the weight vector for an exponential moving average (EMA) of length n if n is the length of the window, then alphalt-2(n1) and ilt-1:n so EmaWeightVectorlt-((alpha(1-alpha)(1-i))) Is this correct Even though the EMA is not really confined to a window with a start and an end, shouldnt the weights add up to 1 just like with the LWMA Thanks Jason, any pointers of how to approximate the EMA filter to any desired precision by approximating it with a long-enough FIR filter There39s a perl script on en. wikipedia. orgwikihellip that made the image of the EMA weight vector, but I don39t understand it: if they set the number of weights to 15 why are there 20 red bars instead of 15 ndash MisterH Dec 19 12 at 22:40Moving Average I have hundreds of thousands of data points stored in data and need to do 100 data point moving average. Can anybody share the logic I know I have to do pop or shift but just cant figure out how to do the moving average. thanks in advance RE: Moving Average KevinADC (TechnicalUser) 18 Sep 08 16:28 I think you are going to need to explain what you are trying to do in detail. Or maybe some knows what 100 data point moving average means. Sample in and sample out data will be helpful. RE: Moving Average rharsh (TechnicalUser) 18 Sep 08 16:31 There are a few different ways to define a moving average. Not in terms of perl (since thats your question) what algorithm would you use to calculate the moving average For example, a simple moving average for 100 data points would be something like: SMA (p p-1 . p-99) 100 Is that what youre looking for RE: Moving Average PinkeyNBrain (ISIT--Management) 18 Sep 08 17:02 This looks a little academic, so just in case Ill explain versus writing code here: - Loop over your data pushing the data points into an array - Track a runningtotal of the values along the way - If size of array lt 99, goto start - calc amp print average - shift array and subtract that amount from your runningtotal - end of loop Red Flag Submitted Thank you for helping keep Tek-Tips Forums free from inappropriate posts. The Tek-Tips staff will check this out and take appropriate action. Reply To This Thread Posting in the Tek-Tips forums is a member-only feature. Click Here to join Tek-Tips and talk with other membersThe belief that a change will be easy to do correctly makes it less likely that the change will be done correctly. An XP programmer writes a unit test to clarify his intentions before he makes a change. We call this test-driven design (TDD) or test-first programming . because an API39s design and implementation are guided by its test cases. The programmer writes the test the way he wants the API to work, and he implements the API to fulfill the expectations set out by the test. Test-driven design helps us invent testable and usable interfaces. In many ways, testability and usability are one in the same. If you can39t write a test for an API, it39ll probably be difficult to use, and vice-versa. Test-driven design gives feedback on usability before time is wasted on the implementation of an awkward API. As a bonus, the test documents how the API works, by example. All of the above are good things, and few would argue with them. One obvious concern is that test-driven design might slow down development. It does take time to write tests, but by writing the tests first, you gain insight into the implementation, which speeds development. Debugging the implementation is faster, too, thanks to immediate and reproducible feedback that only an automated test can provide. Perhaps the greatest time savings from unit testing comes a few months or years after you write the test, when you need to extend the API. The unit test not only provides you with reliable documentation for how the API works, but it also validates the assumptions that went into the design of the API. You can be fairly sure a change didn39t break anything if the change passes all the unit tests written before it. Changes that fiddle with fundamental API assumptions cause the costliest defects to debug. A comprehensive unit test suite is probably the most effective defense against such unwanted changes. This chapter introduces test-driven design through the implementation of an exponential moving average (EMA), a simple but useful mathematical function. This chapter also explains how to use the CPAN modules Test::More and Test::Exception . Unit Tests A unit test validates the programmer39s view of the application. This is quite different from an acceptance test, which is written from the customer39s perspective and tests end-user functionality, usually through the same interface that an ordinary user uses. In constrast, a unit test exercises an API, formally known as a unit. Usually, we test an entire Perl package with a single unit test. Perl has a strong tradition of unit testing, and virtually every CPAN module comes with one or more unit tests. There are also many test frameworks available from CPAN. This and subsequent chapters use Test::More . a popular and well documented test module.2 I also use Test::Exception to test deviance cases that result in calls to die .3 Test First, By Intention Test-driven design takes unit testing to the extreme. Before you write the code, you write a unit test. For example, here39s the first test case for the EMA (exponential moving average) module: This is the minimal Test::More test. You tell Test::More how many tests to expect, and you import the module with useok as the first test case. The BEGIN ensures the module39s prototypes and functions are available during compilation of the rest of the unit test. The next step is to run this test to make sure that it fails: At this stage, you might be thinking, Duh Of course, it fails. Test-driven design does involve lots of duhs in the beginning. The baby steps are important, because they help to put you in the mindset of writing a small test followed by just enough code to satisfy the test. If you have maintenance programming experience, you may already be familiar with this procedure. Maintenance programmers know they need a test to be sure that their change fixes what they think is broken. They write the test and run it before fixing anything to make sure they understand a failure and that their fix works. Test-driven design takes this practice to the extreme by clarifying your understanding of all changes before you make them. Now that we have clarified the need for a module called EMA (duh), we implement it: And, duh, the test passes: Yeeha Time to celebrate with a double cappuccino so we don39t fall asleep. That39s all there is to the test-driven design loop: write a test, see it fail, satisfy the test, and watch it pass. For brevity, the rest of the examples leave out the test execution steps and the concomitant duhs and yeehas. However, it39s important to remember to include these simple steps when test-first programming. If you don39t remember, your programming partner probably will.4 Exponential Moving Average Our hypothetical customer for this example would like to maintain a running average of closing stock prices for her website. An EMA is commonly used for this purpose, because it is an efficient way to compute a running average. You can see why if you look at the basic computation for an EMA: today39s price x weight yesterday39s average x (1 - weight) This algorithm produces a weighted average that favors recent history. The effect of a price on the average decays exponentially over time. It39s a simple function that only needs to maintain two values: yesterday39s average and the weight. Most other types of moving averages, require more data storage and more complex computations. The weight, commonly called alpha . is computed in terms of uniform time periods (days, in this example): 2 (number of days 1) For efficiency, alpha is usually computed once, and stored along with the current value of the average. I chose to use an object to hold these data and a single method to compute the average. Test Things That Might Break Since the first cut design calls for a stateful object, we need to instantiate it to use it. The next case tests object creation: I sometimes forget to return the instance ( self ) so the test calls ok to check that new returns some non-zero value. This case tests what I think might break. An alternative, more extensive test is: This case checks that new returns a blessed reference of class EMA . To me, this test is unnecessarily complex. If new returns something, it39s probably an instance. It39s reasonable to rely on the simpler case on that basis alone. Additionally, there will be other test cases that will use the instance, and those tests will fail if new doesn39t return an instance of class EMA . This point is subtle but important, because the size of a unit test suite matters. The larger and slower the suite, the less useful it will be. A slow unit test suite means programmers will hesitate before running all the tests, and there will be more checkins which break unit andor acceptance tests. Remember, programmers are lazy and impatient, and they don39t like being held back by their programming environment. When you test only what might break, your unit test suite will remain a lightweight and effective development tool. Please note that if you and your partner are new to test-driven design, it39s probably better to err on the side of caution and to test too much. With experience, you39ll learn which tests are redundant and which are especially helpful. There are no magic formulas here. Testing is an art that takes time to master. Satisfy The Test, Don39t Trick It Returning to our example, the implementation of new that satisfies this case is: This is the minimal code which satisfies the above test. length doesn39t need to be stored, and we don39t need to compute alpha. We39ll get to them when we need to. But wait, you say, wouldn39t the following code satisfy the test, too Yes, you can trick any test. However, it39s nice to treat programmers like grown-ups (even though we don39t always act that way). No one is going to watch over your shoulder to make sure you aren39t cheating your own test. The first implementation of new is the right amount of code, and the test is sufficient to help guide that implementation. The design calls for an object to hold state, and an object creation is what needed to be coded. Test Base Cases First What we39ve tested thus far are the base cases . that is, tests that validate the basic assumptions of the API. When we test basic assumptions first, we work our way towards the full complexity of the complete implementation, and it also makes the test more readable. Test-first design works best when the implementation grows along with the test cases. There are two base cases for the compute function. The first base case is that the initial value of the average is just the number itself. There39s also the case of inputting a value equal to the average, which should leave the average unchanged. These cases are coded as follows: The is function from Test::More lets us compare scalar values. Note the change to the instantiation test case that allows us to use the instance ( ema ) for subsequent cases. Reusing results of previous tests shortens the test, and makes it easier to understand. The implementation that satisfies these cases is: The initialization of alpha was added to new . because compute needs the value. new initializes the state of the object, and compute implements the EMA algorithm. self-gt is initially undef so that case can be detected. Even though the implementation looks finished, we aren39t done testing. The above code might be defective. Both compute test cases use the same value, and the test would pass even if, for example, self-gt and value were accidentally switched. We also need to test that the average changes when given different values. The test as it stands is too static, and it doesn39t serve as a good example of how an EMA works. Choose Self-Evident Data In a test-driven environment, programmers use the tests to learn how the API works. You may hear that XPers don39t like documentation. That39s not quite true. What we prefer is self-validating documentation in the form of tests. We take care to write tests that are readable and demonstrate how to use the API. One way to create readable tests is to pick good test data. However, we have a little bootstrapping problem: To pick good test data, we need valid values from the results of an EMA computation, but we need an EMA implementation to give us those values. One solution is to calculate the EMA values by hand. Or, we could use another EMA implementation to come up with the values. While either of these choices would work, a programmer reading the test cases would have to trust them or to recompute them to verify they are correct. Not to mention that we39d have to get the precision exactly right for our target platform. Use The Algorithm, Luke A better alternative is to work backwards through the algorithm to figure out some self-evident test data.5 To accomplish this, we treat the EMA algorithm as two equations by fixing some values. Our goal is to have integer values for the results so we avoid floating point precision issues. In addition, integer values make it easier for the programmer to follow what is going on. When we look at the equations, we see alpha is the most constrained value: today39s average today39s price x alpha yesterday39s average x (1 - alpha) alpha 2 (length 1) Therefore it makes sense to try and figure out a value of alpha that can produce integer results given integer prices. Starting with length 1, the values of alpha decrease as follows: 1, 23, 12, 25, 13, 27, and 14. The values 1, 12, and 25 are good candidates, because they can be represented exactly in binary floating point. 1 is a degenerate case, the average of a single value is always itself. 12 is not ideal, because alpha and 1 - alpha are identical, which creates a symmetry in the first equation: today39s average today39s price x 0.5 yesterday39s average x 0.5 We want asymmetric weights so that defects, such as swapping today39s price and yesterday39s average, will be detected. A length of 4 yields an alpha of 25 (0.4), and makes the equation asymmetric: today39s average today39s price x 0.4 yesterday39s average x 0.6 With alpha fixed at 0.4, we can pick prices that make today39s average an integer. Specifically, multiples of 5 work nicely. I like prices to go up, so I chose 10 for today39s price and 5 for yesterday39s average. (the initial price). This makes today39s average equal to 7, and our test becomes: Again, I revised the base cases to keep the test short. Any value in the base cases will work so we might as well save testing time through reuse. Our test and implementation are essentially complete. All paths through the code are tested, and EMA could be used in production if it is used properly. That is, EMA is complete if all we care about is conformant behavior. The implementation currently ignores what happens when new is given an invalid value for length . Although EMA is a small part of the application, it can have a great impact on quality. For example, if new is passed a length of -1, Perl throws a divide-by-zero exception when alpha is computed. For other invalid values for length . such as -2, new silently accepts the errant value, and compute faithfully produces non-sensical values (negative averages for positive prices). We can39t simply ignore these cases. We need to make a decision about what to do when length is invalid. One approach would be to assume garbage-in garbage-out. If a caller supplies -2 for length . it39s the caller39s problem. Yet this isn39t what Perl39s divide function does, and it isn39t what happens, say, when you try to de-reference a scalar which is not a reference. The Perl interpreter calls die . and I39ve already mentioned in the Coding Style chapter that I prefer failing fast rather than waiting until the program can do some real damage. In our example, the customer39s web site would display an invalid moving average, and one her customers might make an incorrect investment decision based on this information. That would be bad. It is better for the web site to return a server error page than to display misleading and incorrect information. Nobody likes program crashes or server errors. Yet calling die is an efficient way to communicate semantic limits (couplings) within the application. The UI programmer, in our example, may not know that an EMA39s length must be a positive integer. He39ll find out when the application dies. He can then change the design of his code and the EMA class to make this limit visible to the end user. Fail fast is an important feedback mechanism. If we encounter an unexpected die . it tells us the application design needs to be improved. Deviance Testing In order to test for an API that fails fast, we need to be able to catch calls to die and then call ok to validate the call did indeed end in an exception. The function diesok in the module Test::Exception does this for us. Since this is our last group of test cases in this chapter, here39s the entire unit test with the changeds for the new deviance cases highlighted: There are now 9 cases in the unit test. The first deviance case validates that length can39t be negative. We already know -1 will die with a divide-by-zero exception so -2 is a better choice. The zero case checks the boundary condition. The first valid length is 1. Lengths must be integers, and 2.5 or any other floating point number is not allowed. length has no explicit upper limit. Perl automatically converts integers to floating point numbers if they are too large. The test already checks that floating point numbers are not allowed so no explicit upper limit check is required. The implementation that satisfies this test follows: The only change is the addition of a call to die with an unless clause. This simple fail fast clause doesn39t complicate the code or slow down the API, and yet it prevents subtle errors by converting an assumption into an assertion. Only Test The New API One of the most difficult parts of testing is to know when to stop. Once you have been test-infected, you may want to keep on adding cases to be sure that the API is perfect. For example, a interesting test case would be to pass a NaN (Not a Number) to compute . but that39s not a test of EMA . The floating point implementation of Perl behaves in a particular way with respect to NaNs6. and Bivio::Math::EMA will conform to that behavior. Testing that NaNs are handled properly is a job for the Perl interpreter39s test suite. Every API relies on a tremendous amount of existing code. There isn39t enough time to test all the existing APIs and your new API as well. Just as an API should separate concerns so must a test. When testing a new API, your concern should be that API and no others. Solid Foundation In XP, we do the simplest thing that could possibly work so we can deliver business value as quickly as possible. Even as we write the test and implementation, we39re sure the code will change. When we encounter a new customer requirement, we refactor the code, if need be, to facilitate the additional function. This iterative process is called continuous design . which is the subject of the next chapter. It39s like renovating your house whenever your needs change. 7 A system or house needs a solid foundation in order to support continuous renovation. Unit tests are the foundation of an XP project. When designing continuously, we make sure the house doesn39t fall down by running unit tests to validate all the assumptions about an implementation. We also grow the foundation before adding new functions. Our test suite gives us the confidence to embrace change. Quality Software Management: Vol. 1 Systems Thinking . Gerald Weinberg, Dorset House, 1991, p. 236. Part of the Test-Simple distribution, available at search. cpan. orgsearchqueryTest-Simple I used version 0.47 for this book. Just a friendly reminder to program in pairs, especially when trying something new. Thanks to Ion Yadigaroglu for teaching me this technique. In some implementations, use of NaNs will cause a run-time error. In others, they will cause all subsequent results to be a NaN. Don39t let the thought of continuous house renovation scare you off. Programmers are much quieter and less messy than construction workers.
No comments:
Post a Comment