Отстал я от жизни, калькураторы от TI уже OpenCL поддерживают (что неудивительно, ебнул туда ARM-процессор и наслаждаешься результатом). Надеюсь, МЦСТ или Baikal свои запилят.
main(int argc, char *argv[]) спокойно меняется на main() и экономит вам аж 22 байта в исходниках (если вы прогрессор и юзаете UTF8) и 8 байт в выпуке gcc.