MemoryDatasetClient

Memory implementation of the dataset client.

This client stores dataset items in memory using Python lists and dictionaries. No data is persisted between process runs, meaning all stored data is lost when the program terminates. This implementation is primarily useful for testing, development, and short-lived crawler operations where persistent storage is not required.

The memory implementation provides fast access to data but is limited by available memory and does not support data sharing across different processes. It supports all dataset operations including sorting, filtering, and pagination, but performs them entirely in memory.

Hierarchy

DatasetClient
- MemoryDatasetClient

Index

Methods

init

__init__(*, metadata): None

Initialize a new instance.

Preferably use the MemoryDatasetClient.open class method to create a new instance.
Parameters
- keyword-onlymetadata: DatasetMetadata
Returns None

drop

async drop(): None

Overrides DatasetClient.drop
Drop the whole dataset and remove all its items.

The backend method for the Dataset.drop call.
Returns None

get_data

async get_data(*, offset, limit, clean, desc, fields, omit, unwind, skip_empty, skip_hidden, flatten, view): DatasetItemsListPage

Overrides DatasetClient.get_data
Get data from the dataset with various filtering options.

The backend method for the Dataset.get_data call.
Parameters
- optionalkeyword-onlyoffset: int = 0
- optionalkeyword-onlylimit: int | None = 999_999_999_999
- optionalkeyword-onlyclean: bool = False
- optionalkeyword-onlydesc: bool = False
- optionalkeyword-onlyfields: list[str] | None = None
- optionalkeyword-onlyomit: list[str] | None = None
- optionalkeyword-onlyunwind: str | None = None
- optionalkeyword-onlyskip_empty: bool = False
- optionalkeyword-onlyskip_hidden: bool = False
- optionalkeyword-onlyflatten: list[str] | None = None
- optionalkeyword-onlyview: str | None = None
Returns DatasetItemsListPage

get_metadata

async get_metadata(): DatasetMetadata

Overrides DatasetClient.get_metadata
Get the metadata of the dataset.
Returns DatasetMetadata

iterate_items

async iterate_items(*, offset, limit, clean, desc, fields, omit, unwind, skip_empty, skip_hidden): AsyncIterator[dict[str, Any]]

Overrides DatasetClient.iterate_items
Iterate over the dataset items with filtering options.

The backend method for the Dataset.iterate_items call.
Parameters
- optionalkeyword-onlyoffset: int = 0
- optionalkeyword-onlylimit: int | None = None
- optionalkeyword-onlyclean: bool = False
- optionalkeyword-onlydesc: bool = False
- optionalkeyword-onlyfields: list[str] | None = None
- optionalkeyword-onlyomit: list[str] | None = None
- optionalkeyword-onlyunwind: str | None = None
- optionalkeyword-onlyskip_empty: bool = False
- optionalkeyword-onlyskip_hidden: bool = False
Returns AsyncIterator[dict[str, Any]]

open

async open(*, id, name): MemoryDatasetClient

Open or create a new memory dataset client.

This method creates a new in-memory dataset instance. Unlike persistent storage implementations, memory datasets don't check for existing datasets with the same name or ID since all data exists only in memory and is lost when the process terminates.
Parameters
- keyword-onlyid: str | None
  The ID of the dataset. If not provided, a random ID will be generated.
- keyword-onlyname: str | None
  The name of the dataset. If not provided, the dataset will be unnamed.
Returns MemoryDatasetClient

purge

async purge(): None

Overrides DatasetClient.purge
Purge all items from the dataset.

The backend method for the Dataset.purge call.
Returns None

push_data

async push_data(data): None

Overrides DatasetClient.push_data
Push data to the dataset.

The backend method for the Dataset.push_data call.
Parameters
- data: list[Any] | dict[str, Any]
Returns None

Hierarchy

Index

Methods

Methods

__init__

Parameters

keyword-onlymetadata: DatasetMetadata

Returns None

drop

Returns None

get_data

Parameters

optionalkeyword-onlyoffset: int = 0

optionalkeyword-onlylimit: int | None = 999_999_999_999

optionalkeyword-onlyclean: bool = False

optionalkeyword-onlydesc: bool = False

optionalkeyword-onlyfields: list[str] | None = None

optionalkeyword-onlyomit: list[str] | None = None

optionalkeyword-onlyunwind: str | None = None

optionalkeyword-onlyskip_empty: bool = False

optionalkeyword-onlyskip_hidden: bool = False

optionalkeyword-onlyflatten: list[str] | None = None

optionalkeyword-onlyview: str | None = None

Returns DatasetItemsListPage

get_metadata

Returns DatasetMetadata

iterate_items

Parameters

optionalkeyword-onlyoffset: int = 0

optionalkeyword-onlylimit: int | None = None

optionalkeyword-onlyclean: bool = False

optionalkeyword-onlydesc: bool = False

optionalkeyword-onlyfields: list[str] | None = None

optionalkeyword-onlyomit: list[str] | None = None

optionalkeyword-onlyunwind: str | None = None

optionalkeyword-onlyskip_empty: bool = False

optionalkeyword-onlyskip_hidden: bool = False

Returns AsyncIterator[dict[str, Any]]

open

Parameters

keyword-onlyid: str | None

keyword-onlyname: str | None

Returns MemoryDatasetClient

purge

Returns None

push_data

Parameters

data: list[Any] | dict[str, Any]

Returns None

init