Hardware implementation of post quantum signature scheme "Falcon"
The purpose of this thesis is to provide a hardware-based implementation of the Falcon post quantum crypto scheme in the form of a hardware accelerator. As the crypto scheme uses the Fourier representation of polynomials to speed up the operations between them, the most time-consuming operation used...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Γλώσσα: | English |
Έκδοση: |
2022
|
Θέματα: | |
Διαθέσιμο Online: | https://hdl.handle.net/10889/23586 |
id |
nemertes-10889-23586 |
---|---|
record_format |
dspace |
spelling |
nemertes-10889-235862022-11-02T04:36:27Z Hardware implementation of post quantum signature scheme "Falcon" Υλοποίηση σε υλικό του post quantum signature scheme "Falcon" Δαλαμαρίνης, Δημήτριος Dalamarinis, Dimitrios Post quantum cryptography Hardware accelerators Falcon FFT Κρυπτογραφικοί αλγόριθμοι The purpose of this thesis is to provide a hardware-based implementation of the Falcon post quantum crypto scheme in the form of a hardware accelerator. As the crypto scheme uses the Fourier representation of polynomials to speed up the operations between them, the most time-consuming operation used is the actual forward and inverse Fast Fourier Transformation. The FFT/IFFT transformation in the referenced implementation of the algorithm uses emulated double precision arithmetic operations with integer arithmetic and bit manipulations. This is done to provide compatibility with systems such as low area and power micro-processors that does not host an FPU. An optimized implementation is also provided, that uses double precision arithmetic for CPU’s that can perform double precision operations. In the following pages a hardware implementation of a 1024-point Radix-2 DIF FFT is presented. The design uses double precision arithmetic and pre-calculated roots of unity to perform FFT and IFFT operations for sizes up to 1024 points. The maximum operational frequency is 100Mhz and can fit in a small FPGA such as a Zynq Z-7010. For the comparison of the improvement the execution times from two processing systems are used: An I5-10600K CPU @ 4.10 GHz and a Cortex A9 CPU @ 660Mhz. Both CPUs contain an FPU and can use both the referenced and the optimized implementation. It will be shown that the design can improve the referenced implementation in both CPUs by 35%. It can also achieve the same performance for the optimized implementation as the 2 CPUS but for smaller clock frequencies, potentially lowering the power requirements of the calculation. Σκοπός αυτής της εργασίας είναι η υλοποίηση του Falcon post quantum crypto scheme σε υλικό με την μορφή hardware accelerator. Δεδομένου ότι ο κρυπτογραφικός αλγόριθμος χρησιμοποιεί Fourier αναπαράσταση των πολυωνύμων για την επιτάχυνση των μεταξύ τους πράξεων, η ποιο χρονοβόρα διαδικασία είναι ο υπολογισμός του ευθύ και αντίστροφου Fast Fourier Transformation. Ο FFT/IFFT που παρουσιάζεται στην βιβλιογραφία χρησιμοποιεί εξομοιωμένο υπολογισμό αριθμών κινητής υποδιαστολής με χρήση ακεραίας αριθμητικής. Αυτό γίνεται για την συμβατότητα του αλγορίθμου με συστήματα χαμηλής υπολογιστικής ισχύς και κατανάλωσης που δεν φέρουν μονάδες κινητής υποδιαστολής. Υπάρχει και μια βελτιστοποιημένη υλοποίηση η οποία χρησιμοποιεί αριθμητική κινητής υποδιαστολής διπλής ακρίβειας για συστήματα που έχουν δυνατότητα χρήσης της. Στις σελίδες που ακολουθούν θα παρουσιαστεί η υλοποίηση ενός 1024-point Radix-2 DIF FFT. Ο σχεδιασμός χρησιμοποιεί αριθμητική κινητής υποδιαστολής διπλής ακρίβειας και προ-υπολογισμένες roots of unity για τον υπολογισμό FFT/IFFT μεγέθους έως 1024 σημείων. Η μέγιστη λειτουργική συχνότητα είναι 100MHz και μπορεί να χωρέσει σε ένα μικρό FPGA όπως το Zynq Z-7010. Για τη σύγκριση της βελτίωσης χρησιμοποιούνται οι χρόνοι εκτέλεσης από δύο συστήματα επεξεργασίας: Μια CPU I5-10600K @ 4,10 GHz και μια CPU Cortex A9 @ 660 MΗz. Και οι δύο CPU περιέχουν ένα FPU και μπορούν να χρησιμοποιήσουν τόσο την αναφερόμενη όσο και τη βελτιστοποιημένη υλοποίηση. Θα αποδειχθεί ότι ο σχεδιασμός μπορεί να βελτιώσει την αναφερόμενη υλοποίηση και στις δύο CPU έως και 35%. Μπορεί επίσης να επιτύχει την ίδια απόδοση για τη βελτιστοποιημένη υλοποίηση με τις 2 CPUS, αλλά για μικρότερες συχνότητες ρολογιού, μειώνοντας ενδεχομένως τις απαιτήσεις ενέργειας του υπολογισμού. 2022-11-01T10:17:40Z 2022-11-01T10:17:40Z 2022-11-01 https://hdl.handle.net/10889/23586 en application/pdf |
institution |
UPatras |
collection |
Nemertes |
language |
English |
topic |
Post quantum cryptography Hardware accelerators Falcon FFT Κρυπτογραφικοί αλγόριθμοι |
spellingShingle |
Post quantum cryptography Hardware accelerators Falcon FFT Κρυπτογραφικοί αλγόριθμοι Δαλαμαρίνης, Δημήτριος Hardware implementation of post quantum signature scheme "Falcon" |
description |
The purpose of this thesis is to provide a hardware-based implementation of the Falcon post quantum crypto scheme in the form of a hardware accelerator. As the crypto scheme uses the Fourier representation of polynomials to speed up the operations between them, the most time-consuming operation used is the actual forward and inverse Fast Fourier Transformation.
The FFT/IFFT transformation in the referenced implementation of the algorithm uses emulated double precision arithmetic operations with integer arithmetic and bit manipulations. This is done to provide compatibility with systems such as low area and power micro-processors that does not host an FPU. An optimized implementation is also provided, that uses double precision arithmetic for CPU’s that can perform double precision operations.
In the following pages a hardware implementation of a 1024-point Radix-2 DIF FFT is presented. The design uses double precision arithmetic and pre-calculated roots of unity to perform FFT and IFFT operations for sizes up to 1024 points. The maximum operational frequency is 100Mhz and can fit in a small FPGA such as a Zynq Z-7010.
For the comparison of the improvement the execution times from two processing systems are used: An I5-10600K CPU @ 4.10 GHz and a Cortex A9 CPU @ 660Mhz. Both CPUs contain an FPU and can use both the referenced and the optimized implementation. It will be shown that the design can improve the referenced implementation in both CPUs by 35%. It can also achieve the same performance for the optimized implementation as the 2 CPUS but for smaller clock frequencies, potentially lowering the power requirements of the calculation. |
author2 |
Dalamarinis, Dimitrios |
author_facet |
Dalamarinis, Dimitrios Δαλαμαρίνης, Δημήτριος |
author |
Δαλαμαρίνης, Δημήτριος |
author_sort |
Δαλαμαρίνης, Δημήτριος |
title |
Hardware implementation of post quantum signature scheme "Falcon" |
title_short |
Hardware implementation of post quantum signature scheme "Falcon" |
title_full |
Hardware implementation of post quantum signature scheme "Falcon" |
title_fullStr |
Hardware implementation of post quantum signature scheme "Falcon" |
title_full_unstemmed |
Hardware implementation of post quantum signature scheme "Falcon" |
title_sort |
hardware implementation of post quantum signature scheme "falcon" |
publishDate |
2022 |
url |
https://hdl.handle.net/10889/23586 |
work_keys_str_mv |
AT dalamarinēsdēmētrios hardwareimplementationofpostquantumsignatureschemefalcon AT dalamarinēsdēmētrios ylopoiēsēseylikotoupostquantumsignatureschemefalcon |
_version_ |
1771297245701865472 |