Building Automatisert Trading Systemer Java


Så rent en datavitenskapelig forsker er du i den perfekte posisjonen for å komme i gang med algoritmisk handel. Dette er noe jeg har sett på førstehånd på Quantiacs1. hvor forskere og ingeniører er i stand til å hoppe rett inn i automatisert handel uten tidligere erfaring. Med andre ord, programmeringskoteletter er den viktigste ingrediensen som trengs for å komme i gang. For å få en generell forståelse av hvilke utfordringer som venter på deg etter at du har opprettet et algoritmisk handelssystem, sjekk ut dette Quora-innlegget. Å bygge et handelssystem fra grunnen vil kreve litt bakgrunnskunnskap, en handelsplattform, markedsdata og markedsadgang. Selv om det ikke er et krav, vil det være lettere å velge en enkelt handelsplattform som gir de fleste av disse ressursene. Når det er sagt, vil ferdighetene du utvikler bli overført til hvilket som helst programmeringsspråk og nesten hvilken som helst plattform. Tro det eller ei, bygger automatiserte handelsstrategier ikke på grunn av å være markedsekspert. Likevel vil læring av grunnleggende markedsmekanikk hjelpe deg med å oppdage lønnsomme handelsstrategier. Alternativer, Futures og andre Derivater av John C. Hull - Stor første bok for å skrive inn kvantitativ finans, og nærmer seg den fra matematikk siden. Kvantitativ handel av Ernie Chan - Ernie Chan gir den beste introduksjonsboken for kvantitativ handel og går deg gjennom prosessen med å skape handelsalgoritmer i MATLAB og Excel. Algoritmisk handel med futures via maskinlæring - En 5-siders oversikt over bruk av en enkel maskinlæringsmodell til ofte brukte tekniske analyseindikatorer. Heres en samlet leseliste PDF med en fullstendig oversikt over bøker, videoer, kurs og handelsfora. Den beste måten å lære er ved å gjøre, og i tilfelle av automatisert handel som kommer ned til kartlegging og koding. Et godt utgangspunkt er eksisterende eksempler på handelssystemer og eksisterende utstillinger av tekniske analyseteknikker. Videre har en dyktig datavitenskapsmann den ekstra kanten av å kunne bruke maskinlæring til algoritmisk handel. Her er noen av disse ressursene: TradingView - En fantastisk visuell kartleggingsplattform alene, TradingView er en flott lekeplass for å bli komfortabel med teknisk analyse. Det har den ekstra fordelen av å tillate deg å skript trading strategier og bla andre folks handel ideer. Automated Trading Forum - Great online community for å legge inn nybegynnere og finne svar på vanlige quant-problemer når du bare begynner. Kvantfora er et flott sted å bli nedsenket i strategier, verktøy og teknikker. YouTube-seminar om handelsideer med arbeidskodeeksempler på Github. Maskinlæring: Flere presentasjoner på automatisert handel finnes på Quantiacs Quant Club. De fleste fra en vitenskapelig bakgrunn (enten det er datavitenskap eller engineering) har hatt eksponering mot Python eller MATLAB, som tilfeldigvis er populære språk for kvantitativ finans. Quantiacs har opprettet en åpen kildekode verktøykasse som gir backtesting og 15 års historisk markedsdata gratis. Den beste delen er alt som er bygget på både Python og MATLAB, og gir deg muligheten til å utvikle systemet med. Heres en trend trend-trading strategi i MATLAB. Dette er all koden som trengs for å kjøre et automatisert handelssystem, som viser både kraften til MATLAB og Quantiacs Toolbox. Quantiacs lar deg handle 44 futures og alle aksjene i SampP 500. I tillegg støttes en rekke tilleggsbiblioteker som TensorFlow. (Ansvarsfraskrivelse: Jeg jobber hos Quantiacs). Når du er klar til å tjene penger som en quant, kan du bli med på den siste Quantiacs automatiserte handelskonkurransen, med totalt 2,250,000 investeringer tilgjengelig. Kan du konkurrere med de beste quants? 28.4k Visninger middot View Upvotes midtpunkt Ikke for reproduksjon Dette svaret har blitt fullstendig omskrevet Her er 6 hovedkunnskapsbase for bygg algoritmiske handelssystemer. Du bør være kjent med dem alle for å kunne bygge effektive handelssystemer. Noen av begrepene som brukes kan være litt tekniske, men du bør kunne forstå dem av Googling. Merk: (De fleste av) disse gjelder ikke hvis du vil gjøre High-Frequency Trading 1. Markedssteorier Du må forstå hvordan markedet fungerer. Mer spesifikt bør du forstå markedets ineffektivitet, forhold mellom ulike assetproducts og prisadferd. Handelsideer stammer fra markedets ineffektivitet. Du må vite hvordan du skal vurdere markedets ineffektivitet som gir deg en handelskant mot de som ikke gjør det. Å designe effektive roboter innebærer å forstå hvordan automatiserte handelssystemer fungerer. I hovedsak består en algoritmisk handelsstrategi av 3 kjernekomponenter: 1) Oppføringer, 2) Utganger og 3) Posisjonering. Du må designe disse 3 komponentene i forhold til markedets ineffektivitet du tar opp (og nei, dette er ikke en enkel prosess). Du trenger ikke å vite avansert matte (selv om det vil hjelpe hvis du tar sikte på å bygge mer komplekse strategier). God kritisk tenkning ferdigheter og en anstendig forståelse av statistikk vil ta deg veldig langt. Design innebærer backtesting (testing for trading kanten og robusthet) og optimalisering (maksimering ytelse med minimal kurve montering). Du trenger å vite hvordan du skal håndtere en portefølje av algoritmiske handelsstrategier også. Strategier kan være komplementære eller motstridende dette kan føre til uplanlagte økninger i risikoeksponering eller uønsket sikring. Kapitalfordeling er viktig, og du deler kapitaltall i regelmessige intervaller eller belønner vinnerne med mer kapital. Hvis du vet hvilke produkter du vil handle, kan du finne passende handelsplattformer for disse produktene. Deretter lærer du programmeringsspråket API for denne plattformen. Hvis du starter, vil jeg anbefale Quantopian (bare aksjer), Quantconnect (aksjer og FX) eller Metatrader 4 (FX og CFDs på aksjeindekser, aksjer og varer). De programmerte språkene som brukes er henholdsvis Python, C og MQL4. 4. Datastyring Søppel i søppel ut. Unøyaktige data fører til unøyaktige testresultater. Vi trenger rimelig rene data for nøyaktig testing. Rengjøringsdata er et avvik mellom kostnad og nøyaktighet. Hvis du vil ha mer nøyaktige data, må du bruke mer tid (tidspenger) å rense den. Noen problemer som forårsaker skitne data, inkluderer manglende data, dupliserte data, feil data (dårlige flått). Andre problemer som fører til misvisende data inkluderer utbytte, aksjeklover og futures rollovers etc. 5. Risikostyring Det er 2 hovedtyper av risiko: Markedsrisiko og Operasjonell risiko. Markedsrisiko innebærer risiko knyttet til din handelsstrategi. Betraktes det worst case scenarioer Hva skjer hvis en svart svanehendelse som andre verdenskrig skjer Har du sikret bort uønsket risiko Er stillingen din for stor, foruten å håndtere markedsrisiko, må du se på operasjonell risiko. Systemkrasj, tap av internettforbindelse, dårlig utførelsesalgoritme (som fører til dårlig utførte priser, eller tapte handler på grunn av manglende evne til å håndtere requoteshigh slippage) og tyveri av hackere er veldig virkelige problemer. 6. Live Execution Backtesting og live trading er svært forskjellige. Du må velge riktig meglere (MM vs STP vs ECN). Forex Market Nyheter med Forex Trading Forums amp Forex Brokers Anmeldelser er din beste venn, les megler anmeldelser der. Du trenger riktig infrastruktur (sikker VPN og nedetidshåndtering osv.) Og evalueringsprosedyrer (overvåke roboterytelsen din og analyser dem i forhold til markedets ineffektivitetstestoptimeringer) for å administrere roboten gjennom hele levetiden. Du må vite når du skal gripe inn (modifyupdateshutdownturn på roboter) og når du ikke skal. Evaluering og optimalisering av handelsstrategier Pardo (Stor innsikt i metoder for bygging og testing av handelsstrategier) Handel deg med finansiell frihet Van K Tharp (Løftig-agn-tittel til side, denne boken er en flott oversikt over mekaniske handelssystemer) Quantitative Trading Ernest Chan (Flott introduksjon til algo trading på detaljnivå.) Handel og utveksling: Markedsmikrostruktur for utøvere Larry Harris (Markedsmikrostruktur er vitenskapen om hvordan utveksling fungerer og hva som faktisk skjer når en handel er plassert. Det er viktig å vite denne informasjonen selv om du bare har begynt) Algorithmic Trading amp DMA Barry Johnson (Shed lys på banker eksekveringsalgoritmer. Dette er ikke direkte gjeldende din algo trading, men det er godt å vite) Quants Scott Patterson (Krigshistorier av noen topp quants. som sengetid leses) Quantopian (Kode, forskning og diskutere ideer med samfunnet. Bruker Python) Fundamentals of Algo Trading Algo Trading101 (Ansvarsfraskrivelse: Jeg eier denne sitecourse. Lær robot design teorier, markeds teorier og koding. Bruker MQL4) - Bli med i utfordringen (Lær handelskonsepter og backtesting teorier. De har nylig utviklet sin egen backtesting og trading plattform, så denne delen er fortsatt ny for meg. Men deres kunnskapsbase om handelskonsepter er bra.) Anbefalte BlogsForums (disse inkluderer økonomi , trading og algo trading forums): Anbefalte programmeringsspråk: Hvis du vet hvilke produkter du vil handle, kan du finne passende handelsplattformer for disse produktene. Deretter lærer du programmeringsspråket API for denne plattformen. Hvis du starter, vil jeg anbefale Quantopian (bare aksjer), Quantconnect (aksjer og FX) eller Metatrader 4 (FX og CFDs på aksjeindekser, aksjer og varer). De programmerte språkene som brukes er henholdsvis Python, C og MQL4. 16.8k Vis middot Vis Oppvotes middot Ikke for reproduksjon Jeg har en bakgrunn som programmerer og sette opp agilescrum-lag før jeg begynte å se på algoritmisk handel. Verden av algoritmisk handel fascinerer meg, men det kan være litt overveldende. Jeg begynte å få noe perspektiv ved å dykke inn i Quantopian-plattformen, se på quant lectures serien og kjøre mine og tilpassede samfunnsbaserte algo trading systemer i sitt miljø. Som den nedenfor: Jeg skjønte da å komme i dypere raskere, jeg må møte folk som elsker å skape handelsstrategier, men kan ikke programmere - for å matche meg selv som en smidig teamleder og programmerer av handelssystemer. Så jeg skrev en bok om hvordan man lager et team for å implementere dine handelsalgoritmer. Building Trading Systems The Agile Way: Hvordan bygge Winning Algorithmic Trading Systems som et lag. I samfunnet av Quantopian så jeg økonomisk kunnskapsrike mennesker på jakt etter folk til å implementere sine handelsstrategier, men hvor redd for å be programmører å implementere sine ideer. Siden de potensielt kan begynne å drive sine handelsideer uten dem. Jeg løser dette problemet i boken min. For å unngå at programmører løper med ideene dine: Lag en spesifikasjon for din handelsidee som bruker et kodingsramme som er skreddersydd for hvilken type strategi du vil utvikle. Det høres kanskje vanskelig ut, men når du kjenner alle babystrinnene og hvordan de passer sammen, er det ganske greit og morsomt å håndtere. Hvis du likte dette svaret, vær så snill å stemme og følg. 2,7k Visninger middot View Oppvoter midtpunkt Ikke for reproduksjon Selv om dette er et veldig bredt emne med referanser til bygningsalgoritmer, innstilling av infrastruktur, ressursallokering og risikostyring, men jeg vil bare fokusere på den første delen av hvordan skal det arbeides med å bygge vår egen algoritme , og gjør de riktige tingene. 1. Byggestrategi. Noen av de viktigste punktene å merke seg her er: Catch Big Trends - En god strategi må i alle tilfeller tjene penger når markedet er trending. Markeder går med en god trend som varer bare 15-20 av tiden, men dette er tiden da alle katter og hunder (handelsmenn fra alle tidsrammer, intradag, daglig, ukentlig og lang sikt) er ute og handler, og de alle ha ett felles tema. Mange handelsfolk bygger også betydelige reverseringsstrategier der de forsøker å dømme forholdene når prisen har flyttet langt fra gjennomsnittet, og handler mot trenden, men de bør bygges når du har bygget og omsatt noen gode trender etter systemer . Odds for stabling - Folk jobber ofte for å prøve å bygge et system som har et utmerket winloss-forhold, men det er ikke riktig tilnærming. For eksempel vil en algo med en vinner på 70 med en gjennomsnittlig fortjeneste på 100 per handel og gjennomsnittlig tap på 200 per handel bare gjøre 100 per 10 handler (10trade netto). Men et algo med en vinner på 30 med en gjennomsnittlig fortjeneste på 500 per handel og tap på 100 per handel vil gi en netto overskudd på 800 for 10 handler (80trade). Så det er ikke nødvendig at winloss-forholdet skal være bra, men det er oddsen for stabling som bør være bedre. Dette fortsetter med å si kvittere tap små, men la dine vinnere runquot. Quote investing, det er komfortabelt, er sjelden lønnsomt. Quot - Robert Arnott Drawdown - Drawdown er uunngåelig, hvis du følger noen form for strategi. Så mens du designer et algo, prøv ikke å redusere drawdownen eller gjøre noen spesifikke tilpassede betingelser for å ta vare på den nedgangen. Denne spesifikke tilstanden kan i fremtiden virke som en veisklokke i å fange en stor trend, og algoet ditt kan utføre dårlig. Risikostyring - Når du bygger en strategi, bør du alltid ha en utgangsport, uansett hva markedet velger å gjøre. Markedet er et sted for odds, og du må designe et algo for å få deg ut av en handel så snart som mulig dersom den ikke passer din risikofrukt. Vanligvis argumenteres det for at du må risikere 1-2 av kapitalen i hver handel, og er optimal på mange måter, selv om du får arnd 10 falske handler i rekkefølge, vil kapitalen din gå ned med bare 20. Men dette er ikke det tilfelle i faktiske markedsscenariet. Noen avvikende handler vil være mellom 0-1, mens noen kan gå til 3-4, så det er bedre å definere gjennomsnittlig tapskapital per handel og den maksimale kapitalen du kan miste i en handel, da markedene er helt tilfeldige og kan bedømmes . QuoteMore en gang imellom, gjør markedet noe så dumt, det tar pusten bort. Quot - Jim Cramer 2. Testing og optimalisering av strategi slippe. Når vi tester en strategi for historiske data, er vi under forutsetning av at bestillingen vil bli utført på forhåndsdefinert pris ankommet av algoen. Men dette vil aldri være tilfelle, da vi må håndtere markeds beslutningstakere og HFT algo039s nå. Din bestilling i today039s verden vil aldri bli utført til ønsket pris, og det vil bli slippe. Dette må inkluderes i testingen. Market Impact: Volum handlet av algoen er en annen viktig faktor som skal vurderes mens du foretar back-testing og samler historiske resultater. Etter hvert som volumøkningene øker, vil ordrene plassert av algo ha betydelig markedsvirkning, og gjennomsnittsprisen på fylt ordre vil være mye forskjellig. Din algo kan produsere komplette forskjellige resultater i faktiske markedsforhold, hvis du ikke vil studere volumdynamikken din algo har. Optimalisering: De fleste handelsfolk foreslår at du ikke gjør kurvepassing og overoptimalisering, og de er korrekte da markedene er en funksjon av tilfeldige variabler, og ingen to situasjoner vil noensinne være de samme. Så optimalisering av parametere for bestemte situasjoner er en dårlig ide. Jeg vil foreslå at du går for Zonal Optimization. Det er en teknikk som jeg følger, kjøpe identifiserende soner som har lignende egenskaper i form av volatilitet og volum. Optimaliser disse områdene separat, i stedet for å optimalisere for hele perioden. Ovennevnte er noen av de mest grunnleggende og viktigste trinnene jeg følger, når jeg konverterer en grunnleggende tanke til en algoritme og kontrollerer validiteten av den. Sitat Alle har hjernekraft til å følge aksjemarkedet. Hvis du har gjort det gjennom femte klasse matte, kan du gjøre det. quotPeter Lynch 17.2k Vis middot Vis Oppvotes middot Ikke for Reproduksjon Kort svar: Lær matematikk anvendt til handel, struktur av markeder og eventuelt være en topp nettverksdistribuert systemprogrammerer. Det er tre potensielt parallelle spor som kan tas for å lære algoritmisk handel fra grunnen avhengig av det endelige formålet med hvorfor du ønsker å lære det. Her er de i økende rekkefølge av vanskeligheter som også korrelerer med hvor mye det blir din del av ditt levebrød. De tidligere vil åpne mulighetene for de følgende. Du kan stoppe på et hvilket som helst trinn underveis når du har lært nok eller fått en jobb å gjøre det. Hvis du vil være en quant, bruker det meste matteprogramvare og egentlig ikke være programmerer for et algo-system, så er det korte svaret å få en doktorgrad i matematikk, fysikk eller noe matematisk tungt relatert teknikkemne. Prøv å få praktikplasser i topp hedgefond, stupbutikker eller investeringsbanker. Hvis du kan bli ansatt av et vellykket firma, så vil du bli undervist der ellers, det vant bare. Men i alle fall bør du fullføre 039Self Study039-delen nedenfor for å sikre at du virkelig vil gå gjennom forsøket på å få en doktorgrad. Med mindre du er et geni, hvis du ikke har en doktorgrad, kan du konkurrere med de som gjør det med mindre du spesialiserer seg i programmering av handelssystemer. Hvis du ønsker å være mer på programmeringssiden, prøv å søke om ansettelse etter hvert trinn, men ikke ofte enn en gang per år per firma. Selvstudium Det første trinnet er å forstå hva algoritmisk handel virkelig er og hvilke systemer som kreves for å støtte den. I039d anbefaler å lese gjennom quotAlgorithmic Trading amp DMAquot (Johnson, 2010), noe jeg personlig gjorde og kan anbefale. Det vil la deg forstå på et grunnleggende nivå. Deretter bør du programmere din egen bestillingsbok, en enkel markedsdata simulator og en algoritme implementering på din videre med Java eller CC. For ekstra kreditt som vil hjelpe med å få jobb, bør du også skrive ditt eget nettverkskommunikasjonslag fra begynnelsen. På dette punktet kan du kanskje være ferdig med å svare på spørsmålet alene. Men for fullstendighet og nysgjerrighet, vær så snill å fortsette: Den neste boken som skal håndteres, er quotTrading amp Exchanges: Market Microstructure for Practitionersquot (Harris, 2003). Dette vil gå inn i finere detaljer om hvordan markedene fungerer. Det er en annen bok jeg har lest, men ikke helt studert fordi jeg var en systemprogrammerer og ikke en kvant eller en leder på forretningssiden. Til slutt, hvis du vil begynne å lære matematikken på hvordan markedene fungerer, jobber du gjennom teksten og problemene i quotOptions, Futures og Other Derivativesquot (Hull, 2003). Jeg gjorde det gjennom omtrent halvparten av den læreboken, enten som forberedelse til eller som en del av intern opplæring hos en av mine tidligere arbeidsgivere. Jeg tror jeg opprinnelig fant ut om den boken fordi det var enten foreslått eller nødvendig å lese for en av vel ansett MS Financial Mathematics-programmer. For å få en bedre sjanse til å jobbe gjennom et nyfødt feederprogram, fullfør et MS Financial Mathematics-program hvis du ønsker å være programmerer for en handelsplattform eller et team av quants. Hvis du vil være den som designer algos, må du ta en doktorgrad som er forklart tidligere. Hvis du fortsatt er ferdig med college, så prøv å få en praktikplass på samme type steder. Sysselsetting Uansett hvor mye du lærer i bøker og skole, vil ingenting sammenligne med de små detaljene du lærer mens du jobber for et firma. Hvis du ikke kjenner alle kantsaker og vet når modellen din slutter å fungere, vil du tape penger. Jeg håper at svaret på spørsmålet ditt og at i løpet av læringsveien oppdager du om du virkelig ønsker å gå over fra studiet til det virkelige daglige arbeidet. 18.5k Visninger middot View Oppvoter middot Ikke for Reproduksjon Interactive Brokers Interactive Brokers har en virkelig toppskjermende investeringsplattform og anstendig prising. It039 er definitivt et kraftig verktøy, så du kan sannsynligvis få billigere alternativer fra rabattmeglerne som Etrade og Scottrade, men hvis du er seriøs med algoritmisk handel, er IB det hvor det er. InvestFly Suksess handler om å praktisere og teste hypotesen og algoritmer. Back-test, test markeder og sammenlign det med andre. Jeg foretrekker Investfly - Virtual Stock Exchange, Stock Market Game Amp Trading Strategies. men det er massevis av gode programmer der ute. Idea Generasjon Don039t start fra grunn null - Jeg liker å få ideer fra Motiv Investing (Online Brokerage, Investment Ideas, Stock Trading) og Seeking Alpha, men se alltid på det store bildet og tenk på hvordan disse tingene gjelder for din egen hypotese og formler. Skål og lykke 4,5k Vis middot Vis Oppvoter midtpunkt Ikke for reproduksjon Hvis investering er en prosess, så er den logiske konklusjonen automatisering. Algoritmer er ingenting annet enn den ekstreme formaliseringen av en underliggende filosofi. Dette er det visuelle uttrykket for en trading edge Trading edge Vinn gjennomsnittlig gevinst - tap av gjennomsnittlig tap Det forandret livet mitt og måten jeg nærmer seg markedene. Visualiser distribusjonen din, alltid. Det vil hjelpe deg med å klargjøre dine konsepter, kaste lys på dine logiske feil, men først la oss begynne med filosofi og trosløft 1. Hvorfor er det viktig å klargjøre din tro Vi handler vår tro. Enda viktigere handler vi vår underbevisste tro. Hvis du ikke vet hvem du er, markeder er et dyrt sted for å finne outquot, Adam Smith. Mange mennesker tar ikke tid til å fremkalle sin tro og operere på lånte trosretninger. Ubesvarte spørsmål og feil logikk er grunnen til at noen systematiske forhandlere tilpasser seg systemet rundt hver drawdown. Jeg pleide å være slik i mange år. Troutløpsøvelser: Byron Kats arbeid. Etter at jeg fullførte en 2 overbevisninger en dag utfordring i 100 dager, kunne jeg forklare min stil til en bestemor 5 hvorfor. Still deg selv et spørsmål med hvorfor og dykk dypere. Mindsets: ekspansiv og subtraktiv eller smoothie Vs bandhjelp Det er to typer tankegang, og vi trenger begge på forskjellige tidspunkter: Utvidet for å utforske konsepter, ideer, triks osv. Subtraktive: forenkle og klargjøre konsepter Systematiske handelsfolk som mislykkes i å være subtraktive har en smoothie tilnærming. De kaster alle slags ting i sin strategi og blander den med en optimizer. Dårlig trekk: Kompleksitet er en form for latskap Overdriven, subtraherende systematiske handelsmenn har en båndhjelps mentalitet. De kaller hardt alt og så lykke til å patchere. Erotisk tradersquot forstår at det er en dans mellom perioder med leting og tider med hard kjerneforenkling. Enkel er ikke lett Det har tatt meg 3 873 timer, og jeg aksepterer at det kan ta livet 2. Utgang: Begynn med slutten i tankene Kontrastintuitiv sannhet Den eneste tiden når du vet om en handel var lønnsom, er etter utgang, høyre så, fokus på avslutningslogikken først. Etter min mening er hovedårsaken til at folk ikke klarer å automatisere sin strategi, at de fokuserer for mye på oppføring og ikke nok ved utgang. Kvaliteten på dine utgange danner PampL-fordelingen, se diagram over. Bruk enorm tid på å stoppe tapet da det påvirker 4 komponenter i handelssystemet ditt: Vinn, tap, gjennomsnittlig tap, handelsfrekvens Kvaliteten på systemet ditt vil bli bestemt av kvaliteten på ditt stoppfall, 3. Pengene er laget i pengestyringsmodulen Likt vekt er en form for latskap. Størrelsen på innsatsene dine bestemmer formen på avkastningen. Forstå når strategien din ikke virker og redusere størrelsen. Omvendt, øk størrelsen når den virker. Jeg vil skrive mer om stillingsstørrelsen på nettstedet mitt, men det er mange ressurser på internett. 3. Sist og minst, Innføring Etter at du har sett en hel sesong med quotesperate housewivesquot eller quotbreaking badquot, hadde litt sjokolade, gikk hunden, matet Fisken, kalt moren din, så er det tid å tenke på oppføring. Les ovenstående formel, aksjeplukking er ikke en hovedkomponent. Man kan hevde at riktig aksjeplukking kan øke seier. Kanskje, men det er verdiløst dersom det ikke finnes verken utgangspolicy eller pengehåndtering. I probabilistiske termer, etter at du har fast utgang, blir oppføring en sannsynlighet for glideskala 4. Hva skal fokusere når du tester Det er ingen magisk glidende gjennomsnittlig indikatorverdi. Når du tester systemet, fokuserer du på tre ting: False positiver: de eroderer ytelsen. Finn enkle (elegante) måter å redusere dem, arbeid på logikkperioder når strategien ikke virker: ingen strategi virker hele tiden. Vær forberedt på det og utarbeide beredskapsplaner på forhånd. Tweaking systemet under en drawdown er som å lære å svømme i en storm Kjøpekraft og penger ledelse: dette er et annet mot-intuitivt faktum. Systemet ditt kan generere ideer, men du har ikke kjøpekraften til å utføre. Vennligst ta en titt på diagrammet ovenfor. Jeg bygger alle mine strategier fra kortsiden først. Den beste testen av robusthet for en strategi er kort side: Tynt volum brutalt flyktig kortere syklus Platformer jeg startet på WealthLab-utvikleren. Den har en spektakulær posisjon dimensjonering bibliotek. Dette er den eneste plattformen som tillater porteføljebasert backtetting og optimalisering. Jeg tester alle mine konsepter på WLD. Anbefaler sterkt. Det har en ulempe, det forbinder ikke posisjon sizer med ekte live trading. Amibroker er bra også. Den har en API som kobler til interaktive meglere og en anstendig tillitsverker. Vi programmerer på Metatrader for Forex. Dessverre har Metatrader gått ned i kompleksitets kaninhullet. Det er et levende samfunn der ute. MatLab, valgfri våpen for ingeniører. Ingen kommentar. Tradestation Perry Kaufman skrev noen gode bøker om TS. Det er et levende samfunn der ute. Det er lettere enn de fleste andre plattformer. Endelig råd Hvis du vil lære å svømme, må du hoppe i vannet. Mange nybegynnere vil sende sine milliarder dollar ideer til noen billige programmerere et sted. Det virker ikke slik. Du må lære språket, logikken. Brace for en lang reise 14.7k Vis middot Vis Oppvoter middot Ikke for reproduksjon Se på TradeLink (C) eller ActiveQuant (Java). TradeLink039s kode er mer elegant. I039m skriver dette på en mobiltelefon, så vær så snill å unnskyld min korthet. i utgangspunktet se på hva som kommer inn vs hva som går ut som en innledende måte å ramme problemet. I. markedsdata, exhangemarket-hendelser (henrettelser til transaksjoner som systemet ditt plassert, acks, avviser, handelsavbrutt varsel, osv.). Ute. Ordrer, endringer i ordre. quotBuy 100 15.5, IOCquot, for eksempel. IOC umiddelbart eller avbryt. Imellom. strategibeslutninger basert på informasjon samlet inn fra sanntidsdata, sammen med historiske data og andre innganger (trader039s kommando fra hans GUI for å handle morløst aggressivt, etc). Ting som. plassere en bestilling, endre en eksisterende ordre, osv. Nå kan du begynne å adressere den tekniske arkitekturen til et slikt system. Av sentral betydning vil være muligheten til å uttrykke strategien enkelt, elegant, til tross for kompleksiteten av hendelsesbehandlingen involvert (det er flere interessante løpevilkår som kan forvirre systemet med hensyn til markedets tilstand, dine ordrer, for eksempel). Jeg pleide å gjøre dette for å leve og kan nok gå på endeløst, men å skrive på en mobiltelefon er avskrekkende. Håper du fant dette nyttig. Kontakt meg hvis du trenger mer veiledning. 21.2k Vis middot Vis Oppvoter midtpunkt Ikke for reproduksjon Oppdatert 100w siden midot Upvoted av Patrick J Rooney. 5 års handel profesjonelt Jeg spesialiserer meg på avansert o For å begynne med det grunnleggende, få tak i Amibroker (AmiBroker - Download). Amibroker har en lett å lære språk og kraftig backtest-motor der du kan prototype dine ideer. Få også Howard Bandy 039s bok Quantitative Trading Systems. Denne boken er en veldig god introduksjon til konseptene kvant utvikling. You039ll trenger også minst en grunnleggende kunnskap om statistikk. Det er mange gode MOOC-kurs tilgjengelig for dette gratis. Slik som denne One Statistics One - Princeton University Coursera It039s er også verdt å følge The Whole Street. som er en mashup av alle kvantbloggene, hvorav mange publiserer Amibroker-kode med sine ideer. Derfra er it039s verdt å lære Python (lær python - Google Search), og gjør også Andrew Ng039s utmerkede Stanford University Machine Learning kurs, som går gratis på Coursera. Hvis du deretter vil sette dine egne algoritmer på prøve, er gode nettsteder for det Quantconnect eller Quantopian. Endelig har denne fyren noen gode råd om å gjøre det til din karriere quantstart Lykke til med reisen Delvis tatt fra Alan Clement039s svar på Hvordan kan en programvareutvikler i økonomi bli en kvantutvikler 16.2k Vis middot Vis Oppvoter midtpunkt Ikke for ReproduksjonBest Programmeringsspråk for algoritmiske handelssystemer Et av de vanligste spørsmålene jeg mottar i QS-postbag er Hva er det beste programmeringsspråket for algoritmisk handel. Det korte svaret er at det ikke er noe beste språk. Strategiparametere, ytelse, modularitet, utvikling, fleksibilitet og kostnad må alle vurderes. Denne artikkelen vil skissere de nødvendige komponentene i en algoritmisk handelssystemarkitektur og hvordan beslutninger om implementering påvirker valg av språk. For det første vil hovedkomponentene i et algoritmisk handelssystem bli vurdert, for eksempel forskningsverktøy, porteføljeoptimerer, risikostyring og utførelsesmotor. Deretter undersøkes ulike handelsstrategier og hvordan de påvirker systemets utforming. Spesielt vil hyppigheten av handel og det sannsynlige handelsvolumet bli diskutert. Når handelsstrategien er valgt, er det nødvendig å arkivere hele systemet. Dette inkluderer valg av maskinvare, operativsystem og systemresistens mot sjeldne, potensielt katastrofale hendelser. Mens arkitekturen vurderes, må det tas hensyn til ytelse - både til forskningsverktøyene og i live-utførelsesmiljøet. Hva er Trading Systemet som prøver å gjøre Før du bestemmer deg for det beste språket som du skal skrive et automatisert handelssystem, er det nødvendig å definere kravene. Skal systemet være rent utførelsesbasert Vil systemet kreve en risikostyring eller porteføljekonstruksjonsmodul Vil systemet kreve en høy ytelse backtester For de fleste strategier kan handelssystemet deles inn i to kategorier: Forskning og signalgenerering. Forskning er opptatt av evaluering av en strategisk ytelse over historiske data. Prosessen med å evaluere en handelsstrategi over tidligere markedsdata kalles backtesting. Datastørrelsen og algoritmisk kompleksitet vil ha stor innvirkning på beregningsintensiteten til backtesteren. CPU-hastighet og samtidighet er ofte begrensende faktorer for optimalisering av eksekveringshastigheten for forskning. Signalgenerering er opptatt av å generere et sett av handelssignaler fra en algoritme og sende slike ordrer til markedet, vanligvis via en megling. For visse strategier er et høyt ytelsesnivå nødvendig. IO-problemer som nettverksbåndbredde og latens er ofte begrensende for optimalisering av kjøringssystemer. Dermed kan valg av språk for hver komponent i hele systemet være ganske annerledes. Type, frekvens og volum av strategi Typen av anvendt algoritmisk strategi vil ha en betydelig innvirkning på systemets utforming. Det vil være nødvendig å vurdere markedene som handles, tilkoblingen til eksterne dataleverandører, frekvensen og volumet av strategien, avstanden mellom enkel utvikling og ytelsesoptimalisering, samt hvilken som helst tilpasset maskinvare, inkludert samlokalisert tilpasset servere, GPUer eller FPGAer som kan være nødvendige. Teknologifunksjonene for en lavfrekvent amerikansk aksjestrategi vil være vesentlig forskjellig fra en høyfrekvent statistisk arbitragestrategi handel på futures markedet. Før valg av språk må mange dataleverandører evalueres som angår en strategi for hånden. Det vil være nødvendig å vurdere tilkobling til leverandøren, strukturen til eventuelle APIer, aktualitet av dataene, lagringskrav og resiliency i møte med en leverandør som går offline. Det er også lurt å ha rask tilgang til flere leverandører. Ulike instrumenter har alle sine egne lagringsbehov, eksempler som inkluderer flere tickersymboler for aksjer og utløpsdatoer for futures (for ikke å nevne noen spesifikke OTC-data). Dette må legges inn i plattformen. Frekvensen av strategien er sannsynligvis en av de største driverne for hvordan teknologibakken skal defineres. Strategier som bruker data hyppigere enn små eller andre barer krever betydelig vurdering med hensyn til ytelse. En strategi som overskrider andre streker (dvs. kryssdata) fører til en ytelsesdrevet design som det primære kravet. For høyfrekvente strategier må en betydelig mengde markedsdata lagres og evalueres. Programvare som HDF5 eller kdb brukes ofte til disse rollene. For å behandle de omfattende datamengder som er nødvendig for HFT-applikasjoner, må en omfattende optimalisert backtester og kjøresystem brukes. CC (muligens med noen assembler) er sannsynligvis den sterkeste språkkandidaten. Ultra-høyfrekvente strategier vil nesten absolutt kreve tilpasset maskinvare som FPGAer, bytte samlokalisering og kjerne nettverksgrensesnittinnstilling. Forskningssystemer Forskningssystemer involverer vanligvis en blanding av interaktiv utvikling og automatisert skripting. Den førstnevnte foregår ofte innenfor en IDE som Visual Studio, MatLab eller R Studio. Sistnevnte innebærer omfattende numeriske beregninger over mange parametere og datapunkter. Dette fører til et språkvalg som gir et rettferdig miljø for å teste koden, men gir også tilstrekkelig ytelse til å evaluere strategier over flere parameterdimensjoner. Typiske IDEer i dette rommet inkluderer Microsoft Visual CC, som inneholder omfattende feilsøkingsverktøy, kodefyllingsfunksjoner (via Intellisense) og enkle oversikter over hele prosjektstakken (via databasen ORM, LINQ) MatLab. som er designet for omfattende numerisk lineær algebra og vektoriserte operasjoner, men på en interaktiv konsoll måte R Studio. som bryter R statistisk språkkonsoll i en fullverdig IDE Eclipse IDE for Linux Java og C og semi-proprietære IDEer som Enthought Canopy for Python, som inkluderer databehandlingsbiblioteker som NumPy. SciPy. scikit-lær og pandas i et enkelt interaktivt (konsoll) miljø. For numerisk backtesting er alle ovennevnte språk egnet, selv om det ikke er nødvendig å bruke en GUIDE som koden vil bli utført i bakgrunnen. Den primære hensynet på dette stadiet er det av kjøringshastigheten. Et kompilert språk (for eksempel C) er ofte nyttig hvis dimensjonene for backtesting parameter er store. Husk at det er nødvendig å være forsiktig med slike systemer hvis det er tilfelle Tolkede språk som Python bruker ofte høypresterende biblioteker som NumPypandas for backtesting-trinnet, for å opprettholde en rimelig grad av konkurranseevne med kompilerte ekvivalenter. Til slutt vil språket som er valgt for backtesting, bestemmes av spesifikke algoritmiske behov, så vel som omfanget av biblioteker tilgjengelig på språket (mer på det nedenfor). Språket som brukes til backtester og forskningsmiljøer kan imidlertid være helt uavhengig av de som brukes i porteføljekonstruksjon, risikostyring og utførelseskomponenter, slik det vil bli sett. Portefølje - og risikostyring Porteføljebygging og risikostyringskomponenter blir ofte oversett av detaljhandelsalgoritmiske forhandlere. Dette er nesten alltid en feil. Disse verktøyene gir mekanismen som kapital vil bli bevart. De forsøker ikke bare å lette antallet risikobete, men reduserer også transaksjonen av handelen selv, og reduserer transaksjonskostnadene. Sofistikerte versjoner av disse komponentene kan ha en betydelig innvirkning på kvaliteten og konsistensen av lønnsomheten. Det er rett og slett å skape en stabil strategi, da porteføljekonstruksjonsmekanismen og risikostyringen lett kan endres for å håndtere flere systemer. Dermed bør de betraktes som essensielle komponenter ved inngangen til utformingen av et algoritmisk handelssystem. Arbeidet med porteføljesammensetningssystemet er å ta et sett av ønskede bransjer og produsere settet av faktiske handler som minimerer kvelning, opprettholder eksponeringer mot ulike faktorer (som sektorer, aktivaklasser, volatilitet etc.) og optimaliserer kapitalallokering til ulike strategier i en portefølje. Porteføljekonstruksjon reduseres ofte til et lineært algebraproblem (for eksempel en matrisefaktorisering) og dermed er ytelsen svært avhengig av effektiviteten av den numeriske lineære algebraimplementasjonen som er tilgjengelig. Vanlige biblioteker inkluderer uBLAS. LAPACK og NAG for C. MatLab har også omfattende optimaliserte matriksoperasjoner. Python benytter NumPySciPy for slike beregninger. En ofte gjenbalansert portefølje vil kreve et kompilert (og godt optimalisert) matrisebibliotek for å bære dette trinnet, for ikke å flaskehals handelssystemet. Risikostyring er en annen ekstremt viktig del av et algoritmisk handelssystem. Risiko kan komme i mange former: Økt volatilitet (selv om dette kan sees som ønskelig for visse strategier), økte korrelasjoner mellom aktivaklasser, motpartsstandard, serveravbrudd, svarte svanehendelser og uoppdagede feil i handelskoden, for å nevne en få. Risikostyringskomponenter forsøker å forutse virkningene av overdreven volatilitet og korrelasjon mellom aktivaklasser og deres påfølgende effekt (er) på handelskapital. Dette reduserer ofte til et sett med statistiske beregninger som Monte Carlo stresstester. Dette ligner veldig på beregningsbehovene til en derivatprisemotor og vil som sådan være CPU-bundet. Disse simulasjonene er svært parallelliserbare (se nedenfor), og i en viss grad er det mulig å kaste maskinvare på problemet. Utførelsessystemer Arbeidet med utførelsessystemet er å motta filtrerte handelssignaler fra porteføljekonstruksjon og risikostyringskomponenter og sende dem videre til megling eller annen markedsadgang. For de fleste detaljhandelsalgoritmiske handelsstrategier innebærer dette en API eller FIX-tilkobling til en megling som Interactive Brokers. De primære hensynene når du bestemmer deg for et språk, inkluderer kvalitet på API, tilgjengelighet for språkpakker for en API, eksekveringsfrekvens og forventet slipping. Kvaliteten på API-en refererer til hvor godt dokumentert det er, hvilken type ytelse det gir, om det er behov for frittstående programvare som skal nås, eller om en gateway kan etableres på en hodeløs måte (dvs. ingen GUI). Når det gjelder Interactive Brokers, må Trader WorkStation-verktøyet kjøres i et GUI-miljø for å få tilgang til API-en. Jeg måtte en gang installere en Desktop Ubuntu-utgave på en Amazon Cloud-server for å få tilgang til Interactive Brokers eksternt, bare av den grunn. De fleste APIer vil gi et C andor Java-grensesnitt. Det er vanligvis opp til samfunnet å utvikle språkspesifikke wrappers for C, Python, R, Excel og MatLab. Merk at med hver ekstra plugin brukt (spesielt API wrappers) er det mulig for bugs å krype inn i systemet. Test alltid plugins av denne typen, og sørg for at de holdes aktivt. Et verdifullt mål er å se hvor mange nye oppdateringer til en kodebase har blitt gjort i de siste månedene. Utførelsesfrekvens er av største betydning i utførelsesalgoritmen. Legg merke til at hundrevis av ordrer kan sendes hvert minutt og som sådan er ytelsen kritisk. Slippage vil bli påført gjennom et dårlig utførelseseksemplar, og dette vil ha en dramatisk innvirkning på lønnsomheten. Statisk-typede språk (se nedenfor) som CJava er generelt optimale for utførelse, men det er et kompromiss i utviklingstid, testing og enkel vedlikehold. Dynamisk typede språk, som Python og Perl, er nå generelt raske nok. Sørg alltid for at komponentene er utformet på en modulær måte (se nedenfor) slik at de kan byttes ut når systemet skalerer. Arkitektonisk planlegging og utviklingsprosess Komponentene til et handelssystem, frekvens - og volumkrav er omtalt ovenfor, men systeminfrastruktur har ennå ikke blitt dekket. De som handler som en detaljhandler eller arbeider i et lite fond vil trolig ha på seg mange hatter. Det vil være nødvendig å dekke alfa-modellen, risikostyring og utførelsesparametere, og også den endelige implementeringen av systemet. Før du drar inn i bestemte språk, vil utformingen av en optimal systemarkitektur bli diskutert. Separasjon av bekymringer En av de viktigste beslutningene som må gjøres i begynnelsen er hvordan å skille bekymringene i et handelssystem. I programvareutvikling betyr dette i hovedsak hvordan man bryter opp de ulike aspektene av handelssystemet i separate modulære komponenter. Ved å utstede grensesnitt på hver av komponentene er det enkelt å bytte ut deler av systemet for andre versjoner som hjelper ytelse, pålitelighet eller vedlikehold uten å endre ekstern avhengighetskode. Dette er den beste praksis for slike systemer. For strategier ved lavere frekvenser anbefales slike praksiser. For ultrahøyfrekvenshandel kan regelboken ignoreres på bekostning av å tilpasse systemet for enda bedre ytelse. Et mer tett koblet system kan være ønskelig. Å lage et komponentkart av et algoritmisk handelssystem er verdt en artikkel i seg selv. En optimal tilnærming er imidlertid å sørge for at det finnes separate komponenter for de historiske og sanntidsmarkedsdatainngangene, datalagring, datatilgang API, backtester, strategiparametere, porteføljekonstruksjon, risikostyring og automatiserte eksekveringssystemer. For eksempel, hvis datalageren som brukes, for tiden er underpresterende, selv ved betydelige optimaliseringsnivåer, kan den byttes ut med minimal omskrivning til datainntaket eller datatilgangsp API. Så langt som backtesteren og de etterfølgende komponentene er det ingen forskjell. En annen fordel med separerte komponenter er at det tillater at en rekke programmeringsspråk brukes i det totale systemet. Det er ikke nødvendig å være begrenset til et enkelt språk hvis kommunikasjonsmetoden til komponentene er språkavhengig. Dette vil være tilfelle hvis de kommuniserer via TCPIP, ZeroMQ eller annen språkavhengig protokoll. Som et konkret eksempel kan du vurdere om et backtesting system skrives i C for nummerkrympende ytelse, mens porteføljeadministrator og kjøringssystemer er skrevet i Python ved hjelp av SciPy og IBPy. Prestasjonshensyn Prestasjoner er et vesentlig hensyn til de fleste handelsstrategier. For høyere frekvensstrategier er det den viktigste faktoren. Ytelse dekker et bredt spekter av problemer, for eksempel algoritmisk eksekveringshastighet, nettverksforsinkelse, båndbredde, data IO, konkurranseparallelisme og skalering. Hver av disse områdene er individuelt dekket av store lærebøker, så denne artikkelen vil bare skrape overflaten til hvert emne. Arkitektur og språkvalg vil nå bli diskutert med tanke på deres effekt på ytelse. Den rådende visdom som uttalt av Donald Knuth. en av fedrene til datavitenskap, er at for tidlig optimalisering er roten til alt ondt. Dette er nesten alltid tilfelle - unntatt når man bygger en høyfrekvent handelsalgoritme For de som er interessert i lavere frekvensstrategier, er en felles tilnærming å bygge et system på den enkleste måten og bare optimalisere etter hvert som flaskehalsene begynner å vises. Profileringsverktøy brukes til å avgjøre hvor flaskehalser oppstår. Profiler kan gjøres for alle faktorene som er oppført ovenfor, enten i et MS Windows eller Linux-miljø. Det er mange operativsystem og språkverktøy tilgjengelig for det, samt tredjepartsverktøy. Språkvalg vil nå bli diskutert i sammenheng med ytelse. C, Java, Python, R og MatLab inneholder alle høyytelsesbiblioteker (enten som en del av deres standard eller eksternt) for grunnleggende datastruktur og algoritmisk arbeid. C-skip med Standard Template Library, mens Python inneholder NumPySciPy. Vanlige matematiske oppgaver finnes i disse bibliotekene, og det er sjelden gunstig å skrive en ny implementering. Ett unntak er at høyt tilpasset maskinvarearkitektur kreves, og en algoritme gjør omfattende bruk av proprietære utvidelser (for eksempel tilpassede caches). Men ofte gjenoppfinnelse av hjulet avfall tid som kan være bedre brukt å utvikle og optimalisere andre deler av handelsinfrastrukturen. Utviklingstiden er ekstremt verdifull, spesielt i sammenheng med eneste utviklere. Latency er ofte et problem med utførelsessystemet, da forskningsverktøyene vanligvis ligger på samme maskin. For det første kan latens forekomme på flere punkter langs utførelsesbanen. Databaser må konsulteres (disknetwork latency), signaler må genereres (operativsystem, kernel messaging latency), handel signaler sendt (NIC latency) og ordre behandlet (bytte systemer interne latency). For høyere frekvensoperasjoner er det nødvendig å bli godt kjent med kernaloptimalisering, samt optimalisering av nettverksoverføring. Dette er et dypt område og er betydelig utenfor artikkelen, men hvis en UHFT-algoritme er ønsket, så vær oppmerksom på dybden av kunnskap som kreves. Caching er veldig nyttig i verktøykassen til en kvantitativ handelsutvikler. Caching refererer til konseptet om lagring av ofte tilgangsdata på en måte som tillater høyere ytelse, på bekostning av potensiell stallhet av dataene. En vanlig brukstilfelle skjer i webutvikling når du tar data fra en diskbasert relasjonsdatabase og legger den inn i minnet. Eventuelle påfølgende forespørsler om dataene behøver ikke å treffe databasen, og prestasjonsgevinstene kan derfor være vesentlige. For handelssituasjoner kan caching være svært gunstig. For eksempel kan dagens status for en strategiportefølje lagres i en cache til den er rebalansert, slik at listen ikke trenger å bli regenerert på hver krets av handelsalgoritmen. Slike regenerering er sannsynligvis en høy CPU eller disk IO-operasjon. Imidlertid er caching ikke uten sine egne problemer. Regenerering av hurtigbufferdata på en gang, på grunn av volatiliseringen av hurtiglagringsplassen, kan stille betydelig etterspørsel etter infrastruktur. Et annet problem er hundespann. hvor flere generasjoner av en ny bufferkopi utføres under ekstremt høy belastning, noe som fører til kaskadesvikt. Dynamisk minneallokering er en dyr operasjon i programvareutførelse. Derfor er det avgjørende at høyere prestasjonshandel applikasjoner skal være godt klar over hvordan minne blir tildelt og fordelt under programflyten. Nyere språkstandarder som Java, C og Python utfører automatisk automatisk søppelsamling. som refererer til deallokering av dynamisk allokert minne når objekter går utenfor omfanget. Søppelsamling er ekstremt nyttig under utvikling, da det reduserer feil og hjelpevennlighet. Det er imidlertid ofte suboptimal for visse høyfrekvente handelsstrategier. Tilpasset søppelinnsamling er ofte ønsket for disse tilfellene. I Java, for eksempel ved å stille inn søppelkollektor og haugkonfigurasjon, er det mulig å oppnå høy ytelse for HFT-strategier. C gir ikke en innfødt søppelkollektor, og det er derfor nødvendig å håndtere all minneallokering som en del av en objektgjennomføring. Mens potensielt feil utsatt (potensielt fører til dangling pointers) er det ekstremt nyttig å ha finkornet kontroll over hvordan objekter vises i bunken for visse applikasjoner. Når du velger språk, sørg for å studere hvordan søppelsamleren fungerer, og om den kan modifiseres for å optimalisere for et bestemt brukstilfelle. Mange operasjoner i algoritmiske handelssystemer er egnet til parallellisering. Dette refererer til konseptet med å utføre flere programmatiske operasjoner samtidig, dvs. parallelt. Såkalte embarassingly parallelle algoritmer inkluderer trinn som kan beregnes helt uavhengig av andre trinn. Visse statistiske operasjoner, som Monte Carlo-simuleringer, er et godt eksempel på embarassingly parallelle algoritmer, da hver tilfeldig tegning og etterfølgende baneoperasjon kan beregnes uten kjennskap til andre baner. Andre algoritmer er bare delvis parallelliserbare. Fluiddynamiske simuleringer er et eksempel der domenet til beregning kan deles opp, men i siste omgang må disse domenene kommunisere med hverandre og dermed operasjonene er delvis sekvensielle. Paralleliserbare algoritmer er underlagt Amdahls Law. som gir en teoretisk øvre grense til ytelsesøkningen av en parallellisert algoritme når den er underlagt N separate prosesser (for eksempel på en CPU-kjerne eller tråd). Parallellisering har blitt stadig viktigere som et middel til optimalisering siden prosessorens klokkehastighet har stagnert, da nyere prosessorer inneholder mange kjerner som skal utføre parallelle beregninger. Stigningen av forbrukergrafikkhardware (hovedsakelig for videospill) har ført til utviklingen av grafiske prosesseringsenheter (GPUer), som inneholder hundrevis av kjerner for svært samtidige operasjoner. Slike GPUer er nå veldig rimelige. Rammer på høyt nivå, som Nvidias CUDA, har ført til utbredt adopsjon i akademia og finans. Slike GPU-maskinvare er generelt bare egnet for forskningssiden ved kvantitativ finansiering, mens andre mer spesialiserte maskinvare (inkludert Feltprogrammerbare Gate Arrays - FPGAs) brukes til (U) HFT. I dag støtter de fleste moderne langaugene en grad av samtidighet. Således er det greit å optimalisere en backtester, siden alle beregninger er generelt uavhengige av de andre. Skalering i programvare engineering og operasjoner refererer til evnen til systemet til å håndtere stadig økende belastninger i form av større forespørsler, høyere prosessorbruk og mer minneallokering. I algoritmisk handel er en strategi i stand til å skalere hvis den kan akseptere større mengder kapital og fortsatt produsere konsistent avkastning. Handelssteknologi stabelen skalerer hvis den kan tåle større handelsvolumer og økt ventetid uten flaskehalsing. Mens systemene skal være skreddersydde, er det ofte vanskelig å forutse på forhånd hvor en flaskehals vil oppstå. Rigourous logging, testing, profilering og overvåking vil bidra sterkt til å tillate et system å skalere. Språkene er ofte beskrevet som uskalelig. Dette er vanligvis et resultat av feilinformasjon, snarere enn hardt. Det er den totale teknologistakken som bør fastslås for skalerbarhet, ikke språket. Klart visse språk har større ytelse enn andre, spesielt brukstilfeller, men ett språk er aldri bedre enn en annen i alle forstand. En måte å håndtere skala på er å skille bekymringer, som nevnt ovenfor. For å ytterligere introdusere evnen til å håndtere pigger i systemet (dvs. plutselig volatilitet som utløser en flåte av handler), er det nyttig å lage en meldingskøararkitektur. Dette innebærer ganske enkelt å plassere et meldingskøesystem mellom komponenter slik at ordrer blir stablet opp hvis en bestemt komponent ikke klarer å behandle mange forespørsler. I stedet for at forespørsler går tapt, holdes de bare i en stabel til meldingen håndteres. Dette er spesielt nyttig for å sende handler til en utførelsesmotor. Hvis motoren lider under tung ventetid, vil den sikkerhetskopiere handler. En kø mellom handelssignalgeneratoren og utførelses-API-en vil lindre dette problemet på bekostning av potensiell handel slippage. En respektert åpen kildekode meldingskronemegler er RabbitMQ. Maskinvare og operativsystemer Maskinvaren som kjører strategien din, kan få betydelig innvirkning på lønnsomheten til algoritmen din. Dette er ikke et problem begrenset til høyfrekvente handelsmenn heller. Et dårlig valg i maskinvare og operativsystem kan føre til maskinkrasj eller omstart i det mest uopprettelige øyeblikket. Dermed er det nødvendig å vurdere hvor søknaden din vil bli bosatt. Valget er vanligvis mellom en personlig stasjonær maskin, en ekstern server, en skyleverandør eller en utvekslingssamlokalisert server. Stasjonære maskiner er enkle å installere og administrere, spesielt med nyere brukervennlige operativsystemer som Windows 78, Mac OSX og Ubuntu. Desktop systemer har imidlertid noen betydelige ulemper, men. Det fremste er at versjonene av operativsystemer som er designet for stasjonære maskiner, sannsynligvis vil kreve rebootspatching (og ofte i verste fall). De bruker også opp flere beregningsmessige ressurser i kraft av å kreve et grafisk brukergrensesnitt (GUI). Bruk av maskinvare i et hjem (eller lokalt kontor) miljø kan føre til internettforbindelse og strømbruddsproblemer. Den største fordelen med et stasjonært system er at betydelig beregningsgrad kan kjøpes for brøkdel av kostnaden for en ekstern dedikert server (eller et skybasert system) med sammenlignbar hastighet. En dedikert server eller skybasert maskin, mens den ofte er dyrere enn et skrivebordsmulighet, muliggjør mer betydelig redundansinfrastruktur, for eksempel automatiserte data-sikkerhetskopier, muligheten til lettere å sikre oppetid og fjernovervåkning. De er vanskeligere å administrere siden de krever muligheten til å bruke ekstern påloggingsfunksjoner i operativsystemet. I Windows er dette vanligvis via GUI Remote Desktop Protocol (RDP). I Unix-baserte systemer brukes kommandolinjen Secure Shell (SSH). Unix-basert serverinfrastruktur er nesten alltid kommandolinjebasert, noe som gjør at GUI-baserte programmeringsverktøy (for eksempel MatLab eller Excel) umiddelbart kan være ubrukelig. En samlokalisert server, som uttrykket brukes i kapitalmarkedene, er rett og slett en dedikert server som ligger innenfor en bytte for å redusere ventetiden til handelsalgoritmen. Dette er absolutt nødvendig for visse høyfrekvente handelsstrategier, som er avhengige av lav latens for å generere alfa. Det endelige aspektet til maskinvarevalg og valget av programmeringsspråk er plattformuavhengighet. Er det behov for at koden skal gå over flere forskjellige operativsystemer Er koden designet for å bli kjørt på en bestemt type prosessorarkitektur, for eksempel Intel x86x64 eller vil det være mulig å kjøre på RISC-prosessorer som de som er produsert av ARM Disse problemene vil være svært avhengig av frekvens og type strategi som implementeres. Resilience and Testing En av de beste måtene å miste mye penger på algoritmisk handel er å skape et system uten spenning. Dette refererer til holdbarheten til sytemet når det er underlagt sjeldne hendelser, som for eksempel meglingfellesskap, plutselig overflødig volatilitet, regionalt nedetid for en skysservereoperatør eller en tilfeldig sletting av en hel handelsdatabase. År med fortjeneste kan elimineres innen sekunder med en dårlig utformet arkitektur. Det er helt nødvendig å vurdere problemer som debuggng, testing, logging, sikkerhetskopiering, høy tilgjengelighet og overvåkning som kjernekomponenter i systemet. Det er sannsynlig at i noen rimelig komplisert tilpasset kvantitativ handelsapplikasjon vil minst 50 utviklings tid bli brukt på feilsøking, testing og vedlikehold. Nesten alle programmeringsspråk sender enten med en tilhørende debugger eller har respekterte tredjepartsalternativer. I hovedsak tillater en debugger utførelse av et program med innføring av vilkårlig bruddpunkter i kodebanen, som midlertidig stopper gjennomføringen for å undersøke systemets tilstand. Hovedfordelen ved feilsøking er at det er mulig å undersøke kodeksens oppførsel før et kjent krasjpunkt. Feilsøking er en viktig komponent i verktøykassen for å analysere programmeringsfeil. Imidlertid blir de mer brukt i kompilerte språk som C eller Java, da tolkede språk som Python ofte er enklere å feilsøke på grunn av færre LOC og mindre verbose setninger. Til tross for denne tendensen, sender Python med pdb. som er et sofistikert feilsøkingsverktøy. Microsoft Visual C IDE har omfattende GUI-feilsøkingsverktøy, mens for kommandolinjens Linux C-programmator eksisterer gdb debugger. Testing i programvareutvikling refererer til prosessen med å bruke kjente parametere og resultater til bestemte funksjoner, metoder og objekter innenfor en kodebase, for å simulere atferd og evaluere flere kodebaner, noe som bidrar til å sikre at et system oppfører seg som det skal. Et nyere paradigme er kjent som Test Driven Development (TDD), der testkoden er utviklet mot et spesifisert grensesnitt uten implementering. Før ferdigstillelse av den faktiske kodebasen, vil alle tester mislykkes. Som kode er skrevet for å fylle ut blanks, vil testene etter hvert passere, og utviklingen skal da opphøre. TDD krever omfattende forhåndsspesifikasjon design samt en sunn grad av disiplin for å kunne utføre suksess. I C gir Boost et enhetstestingsramme. I Java eksisterer JUnit-biblioteket for å oppfylle samme formål. Python har også den unittest modulen som en del av standardbiblioteket. Mange andre språk har enhetstestingsrammer, og ofte er det flere alternativer. I et produksjonsmiljø er sofistikert logging helt avgjørende. Logging refererer til prosessen med å skrive ut meldinger, med ulike grader av alvorlighetsgrad, angående utførelsesadferd av et system til en flat fil eller database. Logger er en første angrepslinje når du jakter på uventet programkørselstid. Dessverre har manglene i et loggsystem bare en tendens til å bli oppdaget etter det. Som med sikkerhetskopier diskutert nedenfor, bør et loggsystem være gitt i betraktning FØR et system er utformet. Både Microsoft Windows og Linux kommer med omfattende systemloggingskapasitet, og programmeringsspråk har en tendens til å sendes med standard loggbiblioteker som dekker de fleste brukssaker. It is often wise to centralise logging information in order to analyse it at a later date, since it can often lead to ideas about improving performance or error reduction, which will almost certainly have a positive impact on your trading returns. While logging of a system will provide information about what has transpired in the past, monitoring of an application will provide insight into what is happening right now . All aspects of the system should be considered for monitoring. System level metrics such as disk usage, available memory, network bandwidth and CPU usage provide basic load information. Trading metrics such as abnormal pricesvolume, sudden rapid drawdowns and account exposure for different sectorsmarkets should also be continuously monitored. Further, a threshold system should be instigated that provides notification when certain metrics are breached, elevating the notification method (email, SMS, automated phone call) depending upon the severity of the metric. System monitoring is often the domain of the system administrator or operations manager. However, as a sole trading developer, these metrics must be established as part of the larger design. Many solutions for monitoring exist: proprietary, hosted and open source, which allow extensive customisation of metrics for a particular use case. Backups and high availability should be prime concerns of a trading system. Consider the following two questions: 1) If an entire production database of market data and trading history was deleted (without backups) how would the research and execution algorithm be affected 2) If the trading system suffers an outage for an extended period (with open positions) how would account equity and ongoing profitability be affected The answers to both of these questions are often sobering It is imperative to put in place a system for backing up data and also for testing the restoration of such data. Many individuals do not test a restore strategy. If recovery from a crash has not been tested in a safe environment, what guarantees exist that restoration will be available at the worst possible moment Similarly, high availability needs to be baked in from the start. Redundant infrastructure (even at additional expense) must always be considered, as the cost of downtime is likely to far outweigh the ongoing maintenance cost of such systems. I wont delve too deeply into this topic as it is a large area, but make sure it is one of the first considerations given to your trading system. Choosing a Language Considerable detail has now been provided on the various factors that arise when developing a custom high-performance algorithmic trading system. The next stage is to discuss how programming languages are generally categorised. Type Systems When choosing a language for a trading stack it is necessary to consider the type system . The languages which are of interest for algorithmic trading are either statically - or dynamically-typed . A statically-typed language performs checks of the types (e. g. integers, floats, custom classes etc) during the compilation process. Such languages include C and Java. A dynamically-typed language performs the majority of its type-checking at runtime. Such languages include Python, Perl and JavaScript. For a highly numerical system such as an algorithmic trading engine, type-checking at compile time can be extremely beneficial, as it can eliminate many bugs that would otherwise lead to numerical errors. However, type-checking doesnt catch everything, and this is where exception handling comes in due to the necessity of having to handle unexpected operations. Dynamic languages (i. e. those that are dynamically-typed) can often lead to run-time errors that would otherwise be caught with a compilation-time type-check. For this reason, the concept of TDD (see above) and unit testing arose which, when carried out correctly, often provides more safety than compile-time checking alone. Another benefit of statically-typed languages is that the compiler is able to make many optimisations that are otherwise unavailable to the dynamically - typed language, simply because the type (and thus memory requirements) are known at compile-time. In fact, part of the inefficiency of many dynamically-typed languages stems from the fact that certain objects must be type-inspected at run-time and this carries a performance hit. Libraries for dynamic languages, such as NumPySciPy alleviate this issue due to enforcing a type within arrays. Open Source or Proprietary One of the biggest choices available to an algorithmic trading developer is whether to use proprietary (commercial) or open source technologies. Det er fordeler og ulemper for begge tilnærminger. It is necessary to consider how well a language is supported, the activity of the community surrounding a language, ease of installation and maintenance, quality of the documentation and any licensingmaintenance costs. The Microsoft stack (including Visual C, Visual C) and MathWorks MatLab are two of the larger proprietary choices for developing custom algorithmic trading software. Both tools have had significant battle testing in the financial space, with the former making up the predominant software stack for investment banking trading infrastructure and the latter being heavily used for quantitative trading research within investment funds. Microsoft and MathWorks both provide extensive high quality documentation for their products. Further, the communities surrounding each tool are very large with active web forums for both. The software allows cohesive integration with multiple languages such as C, C and VB, as well as easy linkage to other Microsoft products such as the SQL Server database via LINQ. MatLab also has many pluginslibraries (some free, some commercial) for nearly any quantitative research domain. There are also drawbacks. With either piece of software the costs are not insignificant for a lone trader (although Microsoft does provide entry-level version of Visual Studio for free). Microsoft tools play well with each other, but integrate less well with external code. Visual Studio must also be executed on Microsoft Windows, which is arguably far less performant than an equivalent Linux server which is optimally tuned. MatLab also lacks a few key plugins such as a good wrapper around the Interactive Brokers API, one of the few brokers amenable to high-performance algorithmic trading. The main issue with proprietary products is the lack of availability of the source code. This means that if ultra performance is truly required, both of these tools will be far less attractive. Open source tools have been industry grade for sometime. Much of the alternative asset space makes extensive use of open-source Linux, MySQLPostgreSQL, Python, R, C and Java in high-performance production roles. However, they are far from restricted to this domain. Python and R, in particular, contain a wealth of extensive numerical libraries for performing nearly any type of data analysis imaginable, often at execution speeds comparable to compiled languages, with certain caveats. The main benefit of using interpreted languages is the speed of development time. Python and R require far fewer lines of code (LOC) to achieve similar functionality, principally due to the extensive libraries. Further, they often allow interactive console based development, rapidly reducing the iterative development process. Given that time as a developer is extremely valuable, and execution speed often less so (unless in the HFT space), it is worth giving extensive consideration to an open source technology stack. Python and R possess significant development communities and are extremely well supported, due to their popularity. Documentation is excellent and bugs (at least for core libraries) remain scarce. Open source tools often suffer from a lack of a dedicated commercial support contract and run optimally on systems with less-forgiving user interfaces. A typical Linux server (such as Ubuntu) will often be fully command-line oriented. In addition, Python and R can be slow for certain execution tasks. There are mechanisms for integrating with C in order to improve execution speeds, but it requires some experience in multi-language programming. While proprietary software is not immune from dependencyversioning issues it is far less common to have to deal with incorrect library versions in such environments. Open source operating systems such as Linux can be trickier to administer. I will venture my personal opinion here and state that I build all of my trading tools with open source technologies. In particular I use: Ubuntu, MySQL, Python, C and R. The maturity, community size, ability to dig deep if problems occur and lower total cost ownership (TCO) far outweigh the simplicity of proprietary GUIs and easier installations. Having said that, Microsoft Visual Studio (especially for C) is a fantastic Integrated Development Environment (IDE) which I would also highly recommend. Batteries Included The header of this section refers to the out of the box capabilities of the language - what libraries does it contain and how good are they This is where mature languages have an advantage over newer variants. C, Java and Python all now possess extensive libraries for network programming, HTTP, operating system interaction, GUIs, regular expressions (regex), iteration and basic algorithms. C is famed for its Standard Template Library (STL) which contains a wealth of high performance data structures and algorithms for free. Python is known for being able to communicate with nearly any other type of systemprotocol (especially the web), mostly through its own standard library. R has a wealth of statistical and econometric tools built in, while MatLab is extremely optimised for any numerical linear algebra code (which can be found in portfolio optimisation and derivatives pricing, for instance). Outside of the standard libraries, C makes use of the Boost library, which fills in the missing parts of the standard library. In fact, many parts of Boost made it into the TR1 standard and subsequently are available in the C11 spec, including native support for lambda expressions and concurrency. Python has the high performance NumPySciPyPandas data analysis library combination, which has gained widespread acceptance for algorithmic trading research. Further, high-performance plugins exist for access to the main relational databases, such as MySQL (MySQLC), JDBC (JavaMatLab), MySQLdb (MySQLPython) and psychopg2 (PostgreSQLPython). Python can even communicate with R via the RPy plugin An often overlooked aspect of a trading system while in the initial research and design stage is the connectivity to a broker API. Most APIs natively support C and Java, but some also support C and Python, either directly or with community-provided wrapper code to the C APIs. In particular, Interactive Brokers can be connected to via the IBPy plugin. If high-performance is required, brokerages will support the FIX protocol . Conclusion As is now evident, the choice of programming language(s) for an algorithmic trading system is not straightforward and requires deep thought. The main considerations are performance, ease of development, resiliency and testing, separation of concerns, familiarity, maintenance, source code availability, licensing costs and maturity of libraries. The benefit of a separated architecture is that it allows languages to be plugged in for different aspects of a trading stack, as and when requirements change. A trading system is an evolving tool and it is likely that any language choices will evolve along with it. Just Getting Started with Quantitative TradingIt Doesnt Seem Possible. Men det er med våre algoritmiske handelsstrategier Det virker ikke mulig. Et algoritmisk handelssystem med så mye trendidentifikasjon, syklusanalyse, buysell sidevolumstrømmer, flere handelsstrategier, dynamisk inngang, mål og stopppriser, og ultrasnabb signalteknologi. Men det er. Faktisk er AlgoTrades algoritmiske handelssystemplattform den eneste i sitt slag. Ikke mer søker etter varme aksjer, sektorer, varer, indekser eller leser markeds meninger. Algotrades gjør alle søk, timing og handel for deg ved hjelp av vårt algoritmiske handelssystem. AlgoTrades dokumenterte strategier kan følges manuelt ved å motta e-post - og SMS-tekstvarsler, eller det kan være 100 handsfree-handel. Det er opp til deg. Du kan slå av på automatisk handel når som helst, slik at du alltid har kontroll over din skjebne. Automatiserte handelssystemer for dyktige investorer Copyright 2017 - ALGOTRADES - Automatisert algoritmisk handelssystem CFTC REGLE 4.41 - HYPOTETISKE ELLER SIMULERTE RESULTATRESULTATER HAR VISSE BEGRENSNINGER. I FORBINDELSE MED EN AKTUELL PRESTASJONSOPPTAK, FORTSATT SIMULERTE RESULTATER IKKE VIRKELIG HANDEL. OGSÅ SOM HANDLINGENE IKKE ER UTFØRT, HAR RESULTATENE KRAVET FORVERKET FOR KONSEKVENSEN, OM NOEN, AV VISSE MARKEDSFAKTORER, SOM SIKKER LIKVIDITET. SIMULERTE HANDELSPROGRAMMER I ALMINDELIGE ER OGSÅ FØLGENDE AT DE ER DESIGNERT MED HINDSIGHT. INGEN REPRESENTASJON SKAL GJORT AT ENKEL KONTO VIL ELLER ER LIKELIG Å HENT RESULTAT ELLER TAP SOM LIKKER SOM VISES. Ingen representasjon blir gjort eller underforstått at bruken av det algoritmiske handelssystemet vil generere inntekt eller garantere et overskudd. Det er en betydelig risiko for tap knyttet til futures trading og trading exchange traded funds. Futures trading og trading exchange trading fond innebærer en betydelig risiko for tap og er ikke egnet for alle. Disse resultatene er basert på simulerte eller hypotetiske resultatresultater som har visse iboende begrensninger. I motsetning til resultatene som vises i en faktisk ytelsesrekord, representerer disse resultatene ikke reell handel. Også fordi disse handlingene egentlig ikke har blitt utført, kan disse resultatene være under - eller overkompensert for eventuelle konsekvenser av visse markedsfaktorer, som manglende likviditet. Simulerte eller hypotetiske handelsprogrammer generelt er også underlagt det faktum at de er utformet til fordel for ettersyn. Ingen representasjon blir gjort at noen konto vil eller vil trolig oppnå fortjeneste eller tap som ligner på disse blir vist. Informasjon på denne nettsiden er utarbeidet uten hensyn til investeringsmålsettingene, den økonomiske situasjonen og behovene til investorer, og videre tilråder abonnenter å ikke handle på noen opplysninger uten å få bestemt råd fra deres finansielle rådgivere, ikke å stole på informasjon fra nettsiden som den primære basis for sine investeringsbeslutninger og å vurdere egen risikoprofil, risikotoleranse og egne stoppfall. - drevet av Enfold WordPress Theme

Comments