Въведение в ядрото на реактора

1. Въведение

Reactor Core е библиотека на Java 8, която реализира модела на реактивно програмиране. Той е изграден върху спецификацията за реактивни потоци, стандарт за изграждане на реактивни приложения.

От фона на нереактивното развитие на Java, преминаването към реактивност може да бъде доста стръмна крива на обучение. Това става по-голямо предизвикателство при сравняването му с Java 8 Stream API, тъй като те могат да бъдат объркани, че са същите абстракции на високо ниво.

В тази статия ще се опитаме да демистифицираме тази парадигма. Ще правим малки стъпки през Reactor, докато не изградим картина за това как да съставим реактивен код, поставяйки основата за по-напреднали статии, които ще се появят в по-късна поредица.

2. Спецификация на реактивните потоци

Преди да разгледаме Reactor, трябва да разгледаме спецификацията на реактивните потоци. Това е, което Reactor прилага и поставя основите на библиотеката.

По същество Reactive Streams е спецификация за обработка на асинхронни потоци.

С други думи, система, при която много събития се произвеждат и консумират асинхронно. Помислете за поток от хиляди актуализации на акции в секунда, постъпващи във финансово приложение, и той да трябва да реагира своевременно на тези актуализации.

Една от основните цели на това е да се справи с проблема с обратно налягане. Ако имаме производител, който излъчва събития към потребител по-бързо, отколкото може да ги обработи, тогава в крайна сметка потребителят ще бъде затрупан със събития, изчерпвайки системните ресурси.

Обратното налягане означава, че нашият потребител трябва да може да каже на производителя колко данни да изпрати, за да предотврати това, и това е изложено в спецификацията.

3. Зависимости на Maven

Преди да започнем, нека добавим нашите зависимости Maven:

 io.projectreactor reactor-core 3.3.9.RELEASE   ch.qos.logback logback-classic 1.1.3 

Също така добавяме Logback като зависимост. Това е така, защото ще регистрираме изхода на Reactor, за да разберем по-добре потока от данни.

4. Създаване на поток от данни

За да може дадено приложение да реагира, първото нещо, което трябва да може да направи, е да създаде поток от данни.

Това може да е нещо като пример за актуализация на акциите, който дадохме по-рано. Без тези данни нямаше да имаме на какво да реагираме, поради което това е логична първа стъпка.

Reactive Core ни дава два типа данни, които ни позволяват да направим това.

4.1. Поток

Първият начин да направите това е с Flux. Това е поток, който може да излъчва 0..n елементи. Нека се опитаме да създадем прост:

Flux just = Flux.just(1, 2, 3, 4);

В този случай имаме статичен поток от четири елемента.

4.2. Моно

Вторият начин да направите това е с Mono, който представлява поток от 0..1 елемента. Нека опитаме да създадем един:

Mono just = Mono.just(1);

Това изглежда и се държи почти по същия начин като Flux , само че този път сме ограничени до не повече от един елемент.

4.3. Защо не само поток?

Преди да експериментирате допълнително, струва си да подчертаем защо имаме тези два типа данни.

Първо, трябва да се отбележи, че както Flux, така и Mono са изпълнения на интерфейса на Reactive Streams Publisher . И двата класа са съвместими със спецификацията и на тяхно място бихме могли да използваме този интерфейс:

Publisher just = Mono.just("foo");

Но наистина, познаването на тази мощност е полезно. Това е така, защото няколко операции имат смисъл само за един от двата типа и защото той може да бъде по-изразителен (представете си findOne () в хранилище).

5. Абониране за поток

Сега имаме общ преглед на високо ниво за това как да създадем поток от данни, трябва да се абонираме за него, за да може той да излъчва елементите.

5.1. Събиране на елементи

Нека използваме метода Subscribe () , за да съберем всички елементи в поток:

List elements = new ArrayList(); Flux.just(1, 2, 3, 4) .log() .subscribe(elements::add); assertThat(elements).containsExactly(1, 2, 3, 4);

Данните няма да започнат да текат, докато не се абонираме. Забележете, че сме добавили и малко регистриране, това ще бъде полезно, когато погледнем какво се случва зад кулисите.

5.2. Потокът на елементите

С регистрирането на място можем да го използваме, за да визуализираме как данните протичат през нашия поток:

20:25:19.550 [main] INFO reactor.Flux.Array.1 - | onSubscribe([Synchronous Fuseable] FluxArray.ArraySubscription) 20:25:19.553 [main] INFO reactor.Flux.Array.1 - | request(unbounded) 20:25:19.553 [main] INFO reactor.Flux.Array.1 - | onNext(1) 20:25:19.553 [main] INFO reactor.Flux.Array.1 - | onNext(2) 20:25:19.553 [main] INFO reactor.Flux.Array.1 - | onNext(3) 20:25:19.553 [main] INFO reactor.Flux.Array.1 - | onNext(4) 20:25:19.553 [main] INFO reactor.Flux.Array.1 - | onComplete()

На първо място, всичко работи на основната нишка. Нека не навлизаме в никакви подробности за това, тъй като ще разгледаме по-нататък паралелността по-късно в тази статия. Това обаче улеснява нещата, тъй като можем да се справим с всичко по ред.

Сега да преминем през последователността, която сме регистрирали един по един:

  1. onSubscribe () - Това се извиква, когато се абонираме за нашия поток
  2. request(unbounded) – When we call subscribe, behind the scenes we are creating a Subscription. This subscription requests elements from the stream. In this case, it defaults to unbounded, meaning it requests every single element available
  3. onNext() – This is called on every single element
  4. onComplete() – This is called last, after receiving the last element. There's actually a onError() as well, which would be called if there is an exception, but in this case, there isn't

This is the flow laid out in the Subscriber interface as part of the Reactive Streams Specification, and in reality, that's what's been instantiated behind the scenes in our call to onSubscribe(). It's a useful method, but to better understand what's happening let's provide a Subscriber interface directly:

Flux.just(1, 2, 3, 4) .log() .subscribe(new Subscriber() { @Override public void onSubscribe(Subscription s) { s.request(Long.MAX_VALUE); } @Override public void onNext(Integer integer) { elements.add(integer); } @Override public void onError(Throwable t) {} @Override public void onComplete() {} });

We can see that each possible stage in the above flow maps to a method in the Subscriber implementation. It just happens that the Flux has provided us with a helper method to reduce this verbosity.

5.3. Comparison to Java 8 Streams

It still might appear that we have something synonymous to a Java 8 Stream doing collect:

List collected = Stream.of(1, 2, 3, 4) .collect(toList());

Only we don't.

The core difference is that Reactive is a push model, whereas the Java 8 Streams are a pull model. In a reactive approach, events are pushed to the subscribers as they come in.

The next thing to notice is a Streams terminal operator is just that, terminal, pulling all the data and returning a result. With Reactive we could have an infinite stream coming in from an external resource, with multiple subscribers attached and removed on an ad hoc basis. We can also do things like combine streams, throttle streams and apply backpressure, which we will cover next.

6. Backpressure

The next thing we should consider is backpressure. In our example, the subscriber is telling the producer to push every single element at once. This could end up becoming overwhelming for the subscriber, consuming all of its resources.

Backpressure is when a downstream can tell an upstream to send it fewer data in order to prevent it from being overwhelmed.

We can modify our Subscriber implementation to apply backpressure. Let's tell the upstream to only send two elements at a time by using request():

Flux.just(1, 2, 3, 4) .log() .subscribe(new Subscriber() { private Subscription s; int onNextAmount; @Override public void onSubscribe(Subscription s) { this.s = s; s.request(2); } @Override public void onNext(Integer integer) { elements.add(integer); onNextAmount++; if (onNextAmount % 2 == 0) { s.request(2); } } @Override public void onError(Throwable t) {} @Override public void onComplete() {} });

Now if we run our code again, we'll see the request(2) is called, followed by two onNext() calls, then request(2) again.

23:31:15.395 [main] INFO reactor.Flux.Array.1 - | onSubscribe([Synchronous Fuseable] FluxArray.ArraySubscription) 23:31:15.397 [main] INFO reactor.Flux.Array.1 - | request(2) 23:31:15.397 [main] INFO reactor.Flux.Array.1 - | onNext(1) 23:31:15.398 [main] INFO reactor.Flux.Array.1 - | onNext(2) 23:31:15.398 [main] INFO reactor.Flux.Array.1 - | request(2) 23:31:15.398 [main] INFO reactor.Flux.Array.1 - | onNext(3) 23:31:15.398 [main] INFO reactor.Flux.Array.1 - | onNext(4) 23:31:15.398 [main] INFO reactor.Flux.Array.1 - | request(2) 23:31:15.398 [main] INFO reactor.Flux.Array.1 - | onComplete()

Essentially, this is reactive pull backpressure. We are requesting the upstream to only push a certain amount of elements, and only when we are ready.

If we imagine we were being streamed tweets from twitter, it would then be up to the upstream to decide what to do. If tweets were coming in but there are no requests from the downstream, then the upstream could drop items, store them in a buffer, or some other strategy.

7. Operating on a Stream

We can also perform operations on the data in our stream, responding to events as we see fit.

7.1. Mapping Data in a Stream

A simple operation that we can perform is applying a transformation. In this case, let's just double all the numbers in our stream:

Flux.just(1, 2, 3, 4) .log() .map(i -> i * 2) .subscribe(elements::add);

map() will be applied when onNext() is called.

7.2. Combining Two Streams

We can then make things more interesting by combining another stream with this one. Let's try this by using zip() function:

Flux.just(1, 2, 3, 4) .log() .map(i -> i * 2) .zipWith(Flux.range(0, Integer.MAX_VALUE), (one, two) -> String.format("First Flux: %d, Second Flux: %d", one, two)) .subscribe(elements::add); assertThat(elements).containsExactly( "First Flux: 2, Second Flux: 0", "First Flux: 4, Second Flux: 1", "First Flux: 6, Second Flux: 2", "First Flux: 8, Second Flux: 3");

Here, we are creating another Flux that keeps incrementing by one and streaming it together with our original one. We can see how these work together by inspecting the logs:

20:04:38.064 [main] INFO reactor.Flux.Array.1 - | onSubscribe([Synchronous Fuseable] FluxArray.ArraySubscription) 20:04:38.065 [main] INFO reactor.Flux.Array.1 - | onNext(1) 20:04:38.066 [main] INFO reactor.Flux.Range.2 - | onSubscribe([Synchronous Fuseable] FluxRange.RangeSubscription) 20:04:38.066 [main] INFO reactor.Flux.Range.2 - | onNext(0) 20:04:38.067 [main] INFO reactor.Flux.Array.1 - | onNext(2) 20:04:38.067 [main] INFO reactor.Flux.Range.2 - | onNext(1) 20:04:38.067 [main] INFO reactor.Flux.Array.1 - | onNext(3) 20:04:38.067 [main] INFO reactor.Flux.Range.2 - | onNext(2) 20:04:38.067 [main] INFO reactor.Flux.Array.1 - | onNext(4) 20:04:38.067 [main] INFO reactor.Flux.Range.2 - | onNext(3) 20:04:38.067 [main] INFO reactor.Flux.Array.1 - | onComplete() 20:04:38.067 [main] INFO reactor.Flux.Array.1 - | cancel() 20:04:38.067 [main] INFO reactor.Flux.Range.2 - | cancel()

Note how we now have one subscription per Flux. The onNext() calls are also alternated, so the index of each element in the stream will match when we apply the zip() function.

8. Hot Streams

Currently, we've focused primarily on cold streams. These are static, fixed-length streams that are easy to deal with. A more realistic use case for reactive might be something that happens infinitely.

For example, we could have a stream of mouse movements that constantly needs to be reacted to or a twitter feed. These types of streams are called hot streams, as they are always running and can be subscribed to at any point in time, missing the start of the data.

8.1. Creating a ConnectableFlux

One way to create a hot stream is by converting a cold stream into one. Let's create a Flux that lasts forever, outputting the results to the console, which would simulate an infinite stream of data coming from an external resource:

ConnectableFlux publish = Flux.create(fluxSink -> { while(true) { fluxSink.next(System.currentTimeMillis()); } }) .publish();

By calling publish() we are given a ConnectableFlux. This means that calling subscribe() won't cause it to start emitting, allowing us to add multiple subscriptions:

publish.subscribe(System.out::println); publish.subscribe(System.out::println);

If we try running this code, nothing will happen. It's not until we call connect(), that the Flux will start emitting:

publish.connect();

8.2. Throttling

If we run our code, our console will be overwhelmed with logging. This is simulating a situation where too much data is being passed to our consumers. Let's try getting around this with throttling:

ConnectableFlux publish = Flux.create(fluxSink -> { while(true) { fluxSink.next(System.currentTimeMillis()); } }) .sample(ofSeconds(2)) .publish();

Here, we've introduced a sample() method with an interval of two seconds. Now values will only be pushed to our subscriber every two seconds, meaning the console will be a lot less hectic.

Of course, there are multiple strategies to reduce the amount of data sent downstream, such as windowing and buffering, but they will be left out of scope for this article.

9. Concurrency

All of our above examples have currently run on the main thread. However, we can control which thread our code runs on if we want. The Scheduler interface provides an abstraction around asynchronous code, for which many implementations are provided for us. Let's try subscribing to a different thread to main:

Flux.just(1, 2, 3, 4) .log() .map(i -> i * 2) .subscribeOn(Schedulers.parallel()) .subscribe(elements::add);

The Parallel scheduler will cause our subscription to be run on a different thread, which we can prove by looking at the logs. We see the first entry comes from the main thread and the Flux is running in another thread called parallel-1.

20:03:27.505 [main] DEBUG reactor.util.Loggers$LoggerFactory - Using Slf4j logging framework 20:03:27.529 [parallel-1] INFO reactor.Flux.Array.1 - | onSubscribe([Synchronous Fuseable] FluxArray.ArraySubscription) 20:03:27.531 [parallel-1] INFO reactor.Flux.Array.1 - | request(unbounded) 20:03:27.531 [parallel-1] INFO reactor.Flux.Array.1 - | onNext(1) 20:03:27.531 [parallel-1] INFO reactor.Flux.Array.1 - | onNext(2) 20:03:27.531 [parallel-1] INFO reactor.Flux.Array.1 - | onNext(3) 20:03:27.531 [parallel-1] INFO reactor.Flux.Array.1 - | onNext(4) 20:03:27.531 [parallel-1] INFO reactor.Flux.Array.1 - | onComplete()

Concurrency get's more interesting than this, and it will be worth us exploring it in another article.

10. Conclusion

В тази статия дадохме общ преглед на Reactive Core на високо ниво. Обяснихме как можем да публикуваме и да се абонираме за потоци, да прилагаме обратно налягане, да работим с потоци и също да обработваме данните асинхронно. Надяваме се, че това трябва да постави основата за писане на реактивни приложения.

По-късните статии от тази поредица ще обхващат по-напреднала паралелност и други реактивни концепции. Има и друга статия, обхващаща Reactor with Spring.

Изходният код за нашето приложение е достъпен над в GitHub; това е проект на Maven, който трябва да може да работи както е.