Das deutsche QBasic- und FreeBASIC-Forum

Eternal_pain · Anmeldungsdatum: 08.08.2006 Beiträge: 1783 Wohnort: BW/KA

Ich nutze am Desktop eine Auflösung von 1920x1080.

Nachdem ich nu ein weilchen versucht habe die ASM Routinen alle halbwegs zu verstehen um mir dann eine eigene zu basteln hab ich es für's erste aufgegeben und verwende Voltas MMX-Fader, um den verwischten Rand (oben und unten) zu verhindern, begrenze ich die vertikalen grenzen auf 1 bis Höhe-1... bleibt dann durchschnittlich bei ~65 Frames

(is mir zu aber bissle zu schnell und werd da noch ein Timer basteln das es 'entspannt' bleibt)

Gleich mal lappi aufstellen und da testen lächeln

_________________

volta · Anmeldungsdatum: 04.05.2005 Beiträge: 1876 Wohnort: D59192

Hi,
diese MMX-Routine ist eigentlich sehr einfach grinsen

Ich hoffe dies hilft dir sie zu verstehen.

Jojo · Verfasst am: 28.03.2015, 14:42 Titel:

Eternal_pain: Wenn du wissen willst, warum deine Routine so viel langsamer ist: Nein, nicht nur wegen MMX. Du berechnest ständig Dinge neu, die du schon weißt. Multipliaktionen sind (relativ) teuer, trotzdem berechnest du für jeden Pixel mehrmals y * srcPitch bzw (y + 1) * srcPitch.
Dabei bleiben diese Werte die ganze Zeile über konstant! Einmal vor der Schleife berechnen spart dir schon mal diese Verschwendung. Und wenn du die erste Konstante berechnet hast, kannst du die andere ganz einfach mit einer Addition berechnen: y0 = y * srcPitch, yPlus1 = y0 + srcPitch (wobei das noch etwas ist, was ein guter Compiler von selbst tut). Die ganze LoByte/LoWord/etc.-Geschichte scheint mir auch insgesamt sehr ineffektiv, da hier mehrmals werde rumgeshiftet werden.

Ein alter, aber immer noch wahrer Artikel dazu, insbesondere zum ersten Punkt:
http://blog.kebby.org/?p=47
_________________
» Die Mathematik wurde geschaffen, um Probleme zu lösen, die es nicht gäbe, wenn die Mathematik nicht erschaffen worden wäre.

grindstone · Verfasst am: 28.03.2015, 17:03 Titel:

Nachdem ich die ASM-Routine aufgedröselt habe (@Volta: Danke für die Kommentierung) fürchte ich sagen zu müssen: Ihr vergleicht da Äpfel mit Birnen. Während Eternal_pain eine "echte" blur-Funktion geschrieben hat, bei der der Mittelwert von 2x2 (quadratisch) benachbarten Pixeln gebildet wird, ist Voltas Routine ein Fader, der sich an jeweils einer Zeile entlangarbeitet und jeweils den Mittelwert von 3 aufeinanderfolgenden Pixeln bildet - was natürlich deutlich schneller geht.

Ich habe mir einmal den Spaß gemacht, den Fader zur blur-Funktion umzuschreiben:

Eternal_pain · Anmeldungsdatum: 08.08.2006 Beiträge: 1783 Wohnort: BW/KA

Alle mal getestet lächeln

grindstone · Verfasst am: 28.03.2015, 22:26 Titel:

@Eternal_pain: Welchen Effekt möchtest du haben? Soll das Bild nur weichgezeichnet werden, oder soll es langsam verschwinden?

Gruß
grindstone
_________________
For ein halbes Jahr wuste ich nich mahl wie man Proggramira schreibt. Jetzt bin ich einen!

Eternal_pain · Anmeldungsdatum: 08.08.2006 Beiträge: 1783 Wohnort: BW/KA

Der optisch unschöne Effekt war wohl der Fehler in der For/Next bzw Step, hatte eben nur einen korrigiert, nachdem ich beide korrigiert hatte sah es richtig aus, hatte dafür aber auch einen Einbruch um rund ~50FPS gebracht zwinkern

Blur brauch man öffters mal, allerdings habe ich mich in diesem Fall nur dafür entschieden weil es eben diesen Effekt hat das die Punkte bzw Linien
langsam verschwinden, oder eben 'Faden/Ausblenden'

Ich glaube bei XP gab es mal ähnliche Standard-Bildschirmschoner, das mit den fliegenden Dreiecken oder so?! (kann mich nicht mehr so ganz erinnern zwinkern

)
_________________

grindstone · Verfasst am: 28.03.2015, 22:54 Titel:

RockTheSchock · Anmeldungsdatum: 04.04.2007 Beiträge: 138

Euch ist schon klar, dass der ursprüngliche Algorithmus von eternal pain eine art fading factor enthält, indem das berechnete durchnitsspixel quasi durch 2 geteilt wird. Also 4 pixel werden addiert und statt durch 4 durch 8 geteilt. Mit dem shift left um 2 bzw 3 bits. D.h in der blur2 prozedur muss das entsprechend geändert werden

grindstone · Verfasst am: 28.03.2015, 23:12 Titel:

Beim Teilen durch 8 verschwindet das Bild viel zu schnell. Der Fadingfaktor ist dadurch gegeben, daß durch die geringere Schrittweite das gerade heruntergerechnete Pixel wieder als Ausgangswert genommen wird.

Gruß
grindstone
_________________
For ein halbes Jahr wuste ich nich mahl wie man Proggramira schreibt. Jetzt bin ich einen!

volta · Anmeldungsdatum: 04.05.2005 Beiträge: 1876 Wohnort: D59192

@grindstone
@Eternal_pain
Wichtg:
Be MMX-Code muss am schluss die 'emms' Anweisung stehen!!!

Jojo · Verfasst am: 29.03.2015, 19:07 Titel:

Ein weiterer Grund, stattdessen SSE zu verwenden. zwinkern

_________________
» Die Mathematik wurde geschaffen, um Probleme zu lösen, die es nicht gäbe, wenn die Mathematik nicht erschaffen worden wäre.

grindstone · Verfasst am: 29.03.2015, 20:07 Titel:

Nur aus Spaß am Programmieren: Hier noch ein reiner Fader ohne Unschärfe. lächeln

grindstone · Verfasst am: 31.03.2015, 14:14 Titel:

Frage an die Experten: Was ist mit den vorherigen Inhalten der verwendeten Register? Die müssten doch eigentlich am Anfang der Assemblersequenz auf den Stack gelegt und am Ende wieder zurückgeholt werden. Oder kümmert sich der Compiler darum?

Gruß
grindstone
_________________
For ein halbes Jahr wuste ich nich mahl wie man Proggramira schreibt. Jetzt bin ich einen!

volta · Anmeldungsdatum: 04.05.2005 Beiträge: 1876 Wohnort: D59192

Hi,
ncht unbedingt!
FB speichert alles in Variablen (Data-Bereich).
Werte mit denen Prozeduren gefüttert werden, werden auf dem Stack übergeben.
Wichtig ist nur das esp-Register (Stackpointer) zu sichern.
Wenn du ein Programm mit der Option -R kompilierst, kannst du dir das in der asm-Datei ansehen.
_________________
Warnung an Choleriker:
Dieser Beitrag kann Spuren von Ironie & Sarkasmus enthalten.
Zu Risiken & Nebenwirkungen fragen Sie Ihren Therapeuten oder Psychiater.

grindstone · Verfasst am: 31.03.2015, 16:19 Titel:

Stimmt. Ist ja eine Sub und kein Interrupt. Ich bin da wohl ein bisschen Microcontrollergeschädigt... lächeln

Gruß
grindstone
_________________
For ein halbes Jahr wuste ich nich mahl wie man Proggramira schreibt. Jetzt bin ich einen!

grindstone · Verfasst am: 03.04.2015, 13:45 Titel:

So, ich habe die blur-Routine noch ein bisschen getuned. lächeln

Bei mir (XP/Pentium 4/3GHz) schafft sie bei 1280 x 1024 Pixel jetzt 70 FPS.

RockTheSchock · Anmeldungsdatum: 04.04.2007 Beiträge: 138

Und das geht noch schneller.

Das movdqu auf den Bildspeicher in der inneren Schleife kann man evt. noch ändern in movdqa. Bringt aber nur ein paar fps. Da ich nicht sicher bin ob der Bildspeicher immer 16 byte aligned ist, ist es sicherer so.

Eternal_pain · Anmeldungsdatum: 08.08.2006 Beiträge: 1783 Wohnort: BW/KA

Also der letzte ist von der Gerschwindigkeit vermutlich fast unschlagbar mit nahezu 300FPS, allerdings glaube ich das dort noch ein schwerer fehler drinne steckt weil es nach einigen Sekunden regelrecht einbricht, runter auf 65FPS auch nach einem neustart... und von der optik her nicht ganz so schick... aber hut ab, gefällt mir lächeln

_________________

grindstone · Verfasst am: 10.04.2015, 02:01 Titel:

Muß die Maske für pshufb nicht lauten: { 11,10,9,8,15,14,13,12,3,2,1,0,7,6,5,4 } ?

Gruß
grindstone
_________________
For ein halbes Jahr wuste ich nich mahl wie man Proggramira schreibt. Jetzt bin ich einen!