RVO pro korutiny (C++20)

31. 3. 2024 14:49 Ondřej Novák

RVO znamená Return Value Optimization a tentokrát se podíváme na to, jak toto téma ovlivňují korutiny v C++

Co je RVO (Return Value Optimization)

RVO je v C++ standardizované od verze 17. Takže se v tomhle pohledu jedná celkem o novinku. Přesto se překladače snažily o tento typ optimalizace před verzí 17. Pro vysvětlení, o co přesně jde, začnu příkladem

std::string rvo_hello_world() {
    std::string s = "Hello world";
    return s;
}

int main() {
   std::string v  = rvo_hello_world();
   std::cout << v << std::endl;
}

Pamatuji si dobu, kdy se nedoporučovalo takto programovat, protože výše uvedený kód mohl obsahovat až 3× volání kopírovacího konstruktoru objektu std::string. První kopírování se provádělo z s do dočasné proměnné v return, druhé kopírování z return dočasné proměnné do dočasné proměnné ve výrazu kde se funkce volala a třetí kopírování z dočasné proměnné do v.

Lze si tedy představit, že každý, kdo takový kód viděl si trhal vlasy

Tak to už neplatí,a od verze 17 je RVO standardizované. Tedy aspoň v základním použití v ve výrazu return a přitom je tvůrcům překladačů doporučeno implementovat optimalizace při vracení lokální proměnné

RVO v return (základní – guaranteed copy elision)

std::string rvo_hello_world() {
    return std::string ("Hello world")
}

int main() {
   std::string v  = rvo_hello_world();
   std::cout << v << std::endl;
}

V tomto případě konstruujeme string přímo ve výrazu return. V C++17 je tato optimalizace povinná, takže lze takto konstruovat i objekt, který má zakázané kopírování a přesouvání. Překladače toto překládají tak, že volající strana dodá ukazatel na místo, kde volaný provede konstrukci návratové hodnoty. V GCC na platformě x86 se k tomuto používá registr rdi. Příklad: https://godbolt.org/z/zbazEGsd6

main:
        push    rbx
        sub     rsp, 32
        mov     rdi, rsp 
        call    rvo_hello_world()

RVO z lokální proměnné (Non-mandatory copy/move elision)

V prvním odstavci tohoto článku je příklad na použití RVO z lokální proměnné. Překladač může lokální proměnnou konstruovat jako návratovou hodnotu. Tato optimalizace je nepovinná a jsou situace, kdy se nedá použít, například, pokud z funkce na různých místech vracíme různé lokální proměnné.

Foo bar() {
   Foo x =...;
   ...
   return x; //RVO
}

Zde překladač bude vyžadovat existenci kopírovacího nebo přesouvacího konstruktoru, i když je nakonec nepoužije. Následující příklad demonstruje aktivaci RVO, protože třída MyString má sice deklarovaný kopírovací konstruktor, ale nikde není jeho definice. Přesto se příklad přeloží a spustí. Pokud by RVO nebylo aktivní, bude si linker stěžovat, že nemůže najít definici kopírovacího konstruktoru

https://godbolt.org/z/zMxE4bEe7

GCC tyto optimalizace provádí i pro ladící sestavení (Debug)

RVO a korutiny (co_return)

Pokud nahradíme return za co_return, tak zjistíme, že všechno je jinak. Rychle odhalíme, že nefunguje ani základní ani rozšířené RVO

task<std::string> rvo_hello_world() {
    co_return std::string ("Hello world"); //není RVO
}

Ukázku s nekopírovatelným MyString najdete zde: https://godbolt.org/z/eMrvbe19E. Zjistíte, že ukázka nejde přeložit, protože MyString nelze konvertovat samu na sebe… protože by to vyžadovalo kopírování.

Ve skutečnosti RVO u co_return nefunguje, protože co_return se překládá jako volání funkce promise_type::return_value(ret). Tato funkce přijímá výsledek výrazu za co_return jako jediný parametr. Pokud tedy funkce přijímá parametr typu jako je návratový typ, pak dochází ke konstrukci návratové hodnoty před zavoláním funkce. Pro uložení návratové hodnoty tak musíme objekt zkopírovat, nebo přesunou.

Z toho vyplývá, že RVO u co_return není možný. Leda že by existoval nějaký trik

Dva způsoby jak udělat RVO v co_return

Nejprve je třeba dodat, že funkci return_value v třídě promise_type lze napsat jako šablonu.

template<std::convertible_to<T> Arg>
void promise_type::return_value(Arg &&arg) {
    _retval.emplace(std::forward<Arg>(arg));
}

Jedinou podmínkou je, že náš argument lze převést na T. To pak umožňuje zavolat emplace u optional, který zde slouží jako úložiště. Funkce emplace zavolá konstruktor T a předá mu parametr Arg. Nedochází sice ke kopírování, ale s jedním argumentem se moc muziky taky udělat nedá.

Speciální objekt

Toto řešení vyžaduje použití speciálního objektu, který ponese argumenty jako návratovou hodnotu až do konstruktoru. Tady je vyžadována součinnost s cílovým objektem, který tento objekt přijímá v konstruktoru. Například budu mít objekt Foo a ten bude možné konstruovat objektem FooConfig. Objekt Foo není kopírovatelný avšak FooConfig je (nemusí). V co_return tak konstruujeme FooConfig, který pak zkonstruuje Foo na cílovém místě

https://godbolt.org/z/xh838ddGv

Poznámka: V tomto jednoduchém příkladě by se jako speciální objekt dal použít i ukazatel na řetězec (char *), takže program lze přeložit, pokud kód upravíme takto: co_return "Hello world";. Zde funkce return_value() je volána s const char * a ten lze konvertovat na MyString

(Lambda) funkce

O tomto způsobu jsem se dozvěděl v článku Superconstructing super elider a přišlo mi to docela chytrý. I když to nese znaky rovnáku na ohejbák, je to nástroj, který vytrhne trn z paty i v korutinách.

Příkaz co_return připomíná funkci emplace kterou najdete na různých kontejnerech, ať už na optional, nebo mapách, případně na vektoru jako emplace_back nebo emplace_front. Ve všech případech funkce přijímá argumenty, kterými lze zavolat konstruktor typu, který je v kontejneru ukládán. Typicky se používá std::construct_at a tato funkce, která slouží k zahájení života (lifetime) objektu, je typicky implementována pomocí placement new: new (adresa) T( argumenty...)

A přesně tato konstrukce má speciální chování, pokud to zapíšeme takto

new (adresa) T( funkce_vracející_T() )

Tady překladač použije RVO a zavolá funkci, přičemž jí předá pointer na adresa jako místo, kde má zkonstruovat návratovou hodnotu.

Ovšem k naší smůle už nejde napsat co_return funkce_vracejici_T(), protože se funkce nejprve zavolá a do co_return už vstupuje již zkonstruovaná návratová hodnota té funkce, kterou třeba již nelze kopírovat. Takže to není stejný případ. Nemůžeme ani pouze předat lambdu, protože jak bude placement new vědět, že ji má zavolat? Existuje vůbec nějaký objekt, který se pouhým použitím v parametru „zavolá“ jako funkce?

Naštěstí existuje, takovým horkým kandidátem je objekt, který obsahuje operátor přetypování operator T(). Tento operátor je ta funkce, která se zavolá při konstrukci T.

Ve výše uvedeném článku se třída, která implementuje tuto vlastnost jmenuje with_result_of. Implementace je jednoduchá

template<std::invocable<> Fn>
class with_result_of {
public:
    using value_type = std::invoke_result_t<Fn>;

    explicit with_result_of(Fn &fn):_fn(fn) {}
    explicit with_result_of(Fn &&fn):_fn(fn) {}

    operator value_type() const {
        return _fn();
    }

protected:
    Fn &_fn;
};

V korutině by se použila takto:

task<MyString> rvo_hello_world() {
    co_return with_result_of([]{return MyString{"Hello world"};});
}

https://godbolt.org/z/ordqY5fxf

Když budete kód krokovat, zjistíte, že lambda se volá až když funkce return_value zavolá emplace nad interní proměnnou typu optional a tam lze pak provést RVO a výsledek uložit přímo uvnitř této instance.

Výsledný zápis je sice prkenný, ale je to v zásadě jediný obecný způsob, jak provést RVO v korutině. Asi má smysl se tím zabývat tam, kde je o rychlost, nebo kde pracujeme s nepřesouvatelný objekty.

Ještě tu zbývá vyřešit jednoho slona v místnosti. Jde o to, kde je vlastně objekt konstruován. V případě zápisu MyString s = co_await rvo_hello_world() narazíme na stejný problém. Operátor co_await bude chtít kopírovat výsledek do proměnné s a bude si opět stěžovat na zakázaný kopírovací konstruktor. V příkladě výše se používá jiný přístup. Třída task nabízí funkci get_value() která vrací referenci na uloženou proměnnou. Toto je v zásadě ten způsob, jak si zařídit RVO na straně volajícího. V případě libcoro se používá objekt future, který v určitých situacích umí vracet referenci na proměnnou uloženou uvnitř future.

future<MyString> fs = rvo_funkce();
const MyString &s = co_await fs;

Pozor na to, že se nesmím použít přímý zápis přes co_await:

const MyString &s = co_await rvo_funkce(); //chyba

protože obdržím referenci na zničenou proměnnou (future je zničena na konci výrazu) – naštěstí překladač na to upozorní.

Použití co_await nelze demonstrovat v uvedených příkladech bez netriviální implementace awaiteru, tak snad je to pochopitelné bez příkladu.

RVO u korutin tedy můžeme realizovat na straně volaného pomocí vracení lambda funkce, která se zavolá při konstrukci hodnoty uvnitř promise_type korutiny (task) nebo future (libcoro). Přístup ke zkonstruované proměnné lze zajistit tak, že promise_type nebo future použijeme jako úložiště hodnoty a přistupujeme přes referenci.

Známe problémy

Kromě onoho prkenného zápisu existuje ještě jedna situace, kdy to nebude fungovat. Tím je případ, kdy cílový objekt má konstruktor, který přijímá jakýkoliv argument

template<typename Arg>
Foo::Foo(Arg &&arg);

Tady má tento konstruktor přednost místo volání lambdy. Instance třídy with_result_of je tedy předána jako parametr a záleží už pak na Foo co s tím udělá. Pokud takový objekt máme a chceme, aby se správně volala lambda, je třeba Arg omezit přes vhodně použitý concept.

template<typename T, typename ToObj>
concept hasnt_cast_operator = !requires(T t) {
    {t.operator ToObj()};
};

a použití

template<hasnt_cast_operator<Foo> Arg>
Foo::Foo(Arg &&arg);

Řešení v libcoro

Knihovna libcoro má promise_type svých korutin navržené tak, že umožňuje z co_return vždycky vracet lambdu, bez nutnost přepisu přes with_result_of. Lze tedy psát toto:

future<MyString> rvo_hello_world() {
    co_return []{return MyString{"Hello world"};};
}

Podmínkou je, že vrácený typ musí být invocable vracející T. Pak vrácená lambda je zavolána při konstrukci hodnoty uvnitř vracené future. Implementace má jinou vyhodnocovací větev pro tento případ (přes if constexpr)

template<typename ... Args>
void future::set_value(Args && ... args) {
     try {
         clearStorage();
         if constexpr(std::is_reference_v<T>) {
            std::construct_at(&_value, &args...);
         } else if constexpr(sizeof...(Args) == 1 && (invocable_r_exact<Args, value_store_type> && ...)) {
            new (&_value) value_store_type(args()...);
         } else {
            std::construct_at(&_value, std::forward<Args>(args)...);
         }
         _result = Result::value;

// .....

        } catch (...) {
            set_exception(std::current_exception());
        }
    }

Struktura korutiny pro RVO prakticky.

future<T> korutina(...) {
      //kód...
      co_await...;
      //kód...
      co_await...; //poslední co_await

      co_return [&]{  // "patička" korutiny bez co_await
         T res;
         // nastavení result
         res.xyz = abc;
         return res; //RVO
      };
}

Závěr

Tento článek vznikl na popud studia p1663r0, ve kterém se snaží autoři změnit design korutin tak, aby RVO bylo možné v korutinách. Nezdá se ovšem, že by tento návrh byl kdy přijat. Já jsem se snažil jít cestou, která by nejlépe rezonovala s mou knihovnou libcoro. Není to optimální řešení, ale je to určitá cesta.

Přidat názor

1. 4. 2024 10:58

D.A.Tiger

Kdyz o tom tak premyslim, napada me otazka, zda optimalizece RWO neni trocu ohjebak na rovnak.

Ja to vzdycky chapal, tak, ze lokalni promena se pri navratu z funkce rusi. Tudiz pokud ji vracim hodnotou, je nutne ji vytvorit znovu (do kontextu volajici funkce). Pokud ji vsak vracim ukazatelem mam pruser, protoze bude po navratu z funkce ukazovat nekam kde nic uz nema nic byt. Pokud ji vsak vracim referenci, prekladac v ramci optimalizace promenou presune do kontextu volajici funkce. A funguje to i v pripade ze promennou vracim z ruznych casti volane funkce. Pracuji tak retezcove tridy, nebo retezitelne operatory.

Proc je to tedy potreba, jenom kvuli korutinam? Neni to spis zavadeni dalsi komplexity do jazyka? Nehodilo by se spis varovani kompiletoru, ve smyslu : "Pozor budes tvorit novy objekt, nechces radeji vracet referenci"?
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
1. 4. 2024 13:40

Ondřej Novák

RVO určitě potřebuješ, pokud static T foo() je použit jako konstruktor... Je to alternativní způsob konstrukce objektu, zejména oblíbená lidmi, kteří umí i v Rustu (jo trochu si utahuju).

Ale primárně to beru tak, že prostě vrácením objektu chci udělat jeho "přesun" z kontextu do kontextu. A pokud se to podaří bez fyzického přesunu, je to optimalizace.

Tuhle optimalizaci používám právě u coro::future, kdy je třeba získat pointer na tenhle objekt před tím, než je vrácen volajícímu. A potřebuju zajistit, že ten pointer platí i po návratu z té funkce. Proto má zakázaný kopírování a přesun.

Pozor na to, že reference je jiný pointer, takže i u reference můžeš vrátit něco, co referuje něco kde nic není. Na mechanismus prodlužování lifetime referencí bych nespoléhal, ne každý ty pravidla zná
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
2. 4. 2024 0:52

D.A.Tiger

Diky za doplneni ted uz to dava vetsi smysl.

Ondro, muzu te poprostit jeste trochu vice rozvest ten posledni odstavec o referencich, nebo nemas po ruce treba link na nejaky clanek/diskuzi, kde se to vice rozebira? Posledni dobou me dost zaujaly funktory a hodne ted s temito zajmavymi tridami experimetuji a opiram se prave o reference a o tento mechanizmus, takze me to hodne zajima (obvzvlaste zakernosti, ktere nejsou na prvni pohled zrejme).

Jenom na okraj - dokonce jsem si vsiml, ze kdyz o funktorech sveho casu psal do Chipu pan Jaroslav Franek (Jak se na funktor vola), tak tam zminoval past pri predavani instance funktoru do funkce hodnotou. Prislo mi divne proc jednu z moznosti neuvedl prave predani pomoci reference, ktere by cely problem jednoduse vyresilo. Ze by by ho to nenapadlo? To se mi nezda. Tak asi k tomu mel nejaky duvod, jen ho nenapsal.

Dik :)
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
2. 4. 2024 6:21

Ondřej Novák

Asi bych chtěl vidět přímo kus zdrojového kódu, kde to používáš.

Jinak dobrý zdroj informací jsou CppCony. Ohledně referencí jsem si vzpomněl na tenhle

https://youtu.be/XN__qATWExc?si=ORLiGVHzFmC03jPi

Sice mně to nic moc nedalo, většinu jsem věděl dřív, než to speaker vysvětlí, ale někomu to asi pomůže
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
1. 4. 2024 12:27

Baloun

Pokud funguje RVO, tak se na to taky dívat tak, že dělá z čehokoliv co vrací daný typ konstruktor. Tím se vlastně všechny varianty funkce emplace stávají nedostatečný. Řešením by bylo doplnit funkce emplace další, kde by se předával tento "konstruktor". Většinou to ale není problém, protože prostě dojde k move.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
1. 4. 2024 13:36

Ondřej Novák

Emplace je volání konstruktoru. Problém je, že co_return vrací jen jednu hodnotu.

emplace se píše jako

emplace(arg1,arg2,arg3...)

zatímco emplace(T(arg1,arg2,arg3...)) je automaticky move

stejně tak emplace(funkce()) je automaticky move

Určitým řešením by bylo co_return {arg1,arg2,arg3...} ale nebyl jsem schopen tuhle variantu jakkoliv zprovoznit.

takže zatím zbývá emplace(with_return_of([]{return T(arg1,arg2,arg3....);}))
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
1. 4. 2024 15:15

Baloun

Ano právě že emplace je volání konstruktoru. Mě osobně přijde překvapivý, že with_return_of funguje, protože emplace v tomto případě nevolá konstruktor, ale operátor přetypování ve kterém je konstruktor. Dobrý vědět.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
1. 4. 2024 16:00

Ondřej Novák

Protože new(addr) T(foo()) není volání konstruktoru, ale volání funkce s RVO, tedy funkce dostane pointer addr a konstrukce proběhne v return.

new (addr) T(x), pokud x je typu, kterým nelze T() zavolat, ale obsahuje operator T(), pak

new (addr) T(x.operator T()) ---> new (addr) T(foo())
- Zobrazit celé vlákno

Přidat názor

Ondřej Novák

Intenzivně se zabývám programováním zejména v jazyce C++. Vyvíjím vlastní knihovny, vzory, techniky, používám šablony, to vše proto, aby se mi usnadnil život při návrhu aplikací. Pracoval jsem jako programátor ve společnosti Seznam.cz. Nyní jsem se usadil v jednom startupu, kde vyvíjím serverové komponenty a informační systémy v C++

Sdílet

Ondřej Novák

Nejčtenější články autora

Poslední názory

Témata

RVO pro korutiny (C++20)

Co je RVO (Return Value Optimization)

RVO v return (základní – guaranteed copy elision)

RVO z lokální proměnné (Non-mandatory copy/move elision)

RVO a korutiny (co_return)

Dva způsoby jak udělat RVO v co_return

Speciální objekt

(Lambda) funkce

Známe problémy

Řešení v libcoro

Struktura korutiny pro RVO prakticky.

Závěr

Sdílet

Ondřej Novák

Nejčtenější články autora

Poslední názory

Témata

Dále u nás najdete

Výrobce koupelnového vybavení Laufen čeká oživení poptávky

Češi spoluvyvíjí technologii, která může změnit mobilní sítě

ČT musela upravit reportáž v iVysílání

Vesna a další, kdo přežili volný pád z několika kilometrů

„Letní sádra“ sice může do vody, na plavání a tobogány ale zapomeňte

Intolerance lepku byla po staletí záhadou. Vysvětlil ji až hladomor

Motání hlavy může být způsobeno problémy s krčními tepnami

Proč vystavujeme zápočtový list a proč ho vyžadujeme?

Albert testuje umělou inteligenci, ušetří čas pokladním i zákazníkům

Jak se daří novým televizním stanicím?

Propagační leták v Canvě zvládnete za pár minut

Zmatek u důchodové reformy, stejný termín pro dvě opatření

Tesco na jedné straně plasty šetří, na druhé jimi ale plýtvá

Chráníme totožnost podatele podnětu, tvrdil úřad

Kolik a čeho mají vypít při sportu v horkém létě

Rozjíždí se nový typ podvodů – lajkovací brigády

Musk: Humanoidní roboty začne Tesla používat už příští rok

Trdlokafe otevřelo první pobočku v USA

Allegro v ČR spouští výdejní boxy, WE|DO se mění na One by Allegro

S haluxy můžete mít boty na pojišťovnu